向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
构建数据基础制度 更好发挥数据要素作用——国家发展改革委负责同志答记者问******
新华社北京12月19日电题:构建数据基础制度更好发挥数据要素作用——国家发展改革委负责同志答记者问
新华社记者潘洁
数据基础制度建设事关国家发展和安全大局。《中共中央国务院关于构建数据基础制度更好发挥数据要素作用的意见》(“数据二十条”)19日对外发布。意见出台的总体考虑是什么?怎样理解其内涵?记者就此采访了国家发展改革委负责同志。
问:“数据二十条”出台的背景是什么?
答:数据作为新型生产要素,具有无形性、非消耗性等特点,可以接近零成本无限复制,对传统产权、流通、分配、治理等制度提出新挑战,亟需构建与数字生产力发展相适应的生产关系,不断解放和发展数字生产力。按照党中央、国务院决策部署,国家发展改革委牵头研究起草“数据二十条”,组建跨学科专家队伍,赴多地深入调研,并吸纳了各方面有关意见。习近平总书记主持召开中央全面深化改革委员会第二十六次会议,审议通过了“数据二十条”。
问:构建数据基础制度体系有哪些重大意义?
答:构建数据基础制度体系,是新时代我国改革开放事业持续向纵深推进的标志性、全局性、战略性举措,有利于充分发挥数据要素作用,赋能实体经济,推动高质量发展;有利于做强做优做大数字经济,应对科技革命和产业变革,构筑国际竞争新优势;有利于统筹分配效率与公平,推动全民共享数字经济发展红利,促进实现共同富裕;有利于提高数据要素治理效能,助力国家治理体系和治理能力现代化。
问:怎样理解“数据二十条”的主要内容?
答:把握一条主线。坚持促进数据合规高效流通使用、赋能实体经济这一主线,以充分实现数据要素价值、促进全体人民共享数字经济发展红利为目标。
构建四个制度。建立保障权益、合规使用的数据产权制度,探索数据产权结构性分置制度,建立数据资源持有权、数据加工使用权、数据产品经营权“三权分置”的数据产权制度框架;建立合规高效、场内外结合的数据要素流通和交易制度,从规则、市场、生态、跨境等四个方面构建适应我国制度优势的数据要素市场体系;建立体现效率、促进公平的数据要素收益分配制度,在初次分配阶段,按照“谁投入、谁贡献、谁受益”原则,推动数据要素收益向数据价值和使用价值创造者合理倾斜,在二次分配、三次分配阶段,重点关注公共利益和相对弱势群体,防止和依法规制资本在数据领域无序扩张形成市场垄断等各类风险挑战;建立安全可控、弹性包容的数据要素治理制度,构建政府、企业、社会多方协同的治理模式。
推进四项措施。加强党对构建数据基础制度工作的全面领导;加大政策支持力度,做大做强数据要素型企业;积极鼓励试验探索,支持浙江等地区和有条件的行业、企业先行先试;稳步推进制度建设,逐步完善数据产权界定、数据流通和交易等主要领域关键环节的政策及标准。
问:“数据二十条”提出数据产权“三权分置”的相关考虑是什么?
答:在数据生产、流通、使用等过程中,个人、企业、社会、国家等相关主体对数据有着不同利益诉求,且呈现复杂共生、相互依存、动态变化等特点,传统权利制度框架难以突破数据产权困境。
“数据二十条”以解决市场主体遇到的实际问题为导向,创新数据产权观念,淡化所有权、强调使用权,聚焦数据使用权流通,创造性提出建立数据资源持有权、数据加工使用权和数据产品经营权“三权分置”的数据产权制度框架,构建中国特色数据产权制度体系。
问:“数据二十条”提出构建多层次数据交易市场体系有什么考虑?
答:由于数据特性复杂,数据交易存在确权难、定价难、互信难、监管难等挑战。“数据二十条”提出从流通规则、交易市场、服务生态等方面加强数据流通交易顶层设计,建立数据流通准入标准规则,探索开展数据质量标准化体系建设;统筹优化全国数据交易场所规划布局,出台数据交易场所管理办法,构建多层次市场交易体系;培育数据商和第三方专业服务机构两类主体。
问:下一步,在推动“数据二十条”落实方面有哪些安排?
答:一是健全政策顶层设计。围绕“数据二十条”不断丰富完善数据要素各方面制度体系和配套政策,打造“1+N”数据基础制度体系。
二是推进实施试点示范。在有条件的地方和行业开展数据要素流通使用试点示范,推动公共数据、企业数据、个人数据合规高效流通使用,赋能实体经济发展。
三是培育数据要素市场。构建多层次、多元化数据要素市场生态体系,统筹数据交易市场建设,规范数据交易管理,推进数据交易场所和数据商功能分离。
四是夯实数据要素基础设施。探索建设全国一体化数据要素登记存证平台,推进数据要素领域创新平台布局,立体化推动“东数西算”工程,形成“算力”和“数据”相结合的数据产业生态体系。
五是强化数据要素高质量供给。健全完善公共数据授权运营机制,制定促进公共数据开发利用的政策法规,服务社会公共管理,赋能实体经济发展。完善政策工具箱,引导大型央企国企、大型互联网企业加大数据流通使用,赋能中小企业数字化转型。
六是加强工作整体统筹力度。发挥数字经济发展部际联席会议作用,促进跨地区跨部门跨层级协同联动,定期对数据基础制度建设情况进行评估,适时进行动态调整,推动数据基础制度体系不断丰富完善。
(文图:赵筱尘 巫邓炎)