向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
东西问|张明祥:保护“地球之肾”,中国如何提供“范本”?******
中新社武汉11月11日电 题:保护“地球之肾”,中国如何提供“范本”?
——专访北京林业大学生态与自然保护学院教授张明祥
中新社记者 张芹 梁婷
《湿地公约》第十四届缔约方大会11月5日至13日在中国武汉和瑞士日内瓦同步举办,是中国首次承办这一国际盛会。自1992年加入《湿地公约》以来,中国的湿地保护经历了摸清家底夯实基础、抢救性保护、全面保护三个阶段,中国湿地保护已经进入高质量发展阶段,并形成了湿地保护的“中国模式”。
30年来,中国在湿地保护方面取得了哪些成就?向世界分享了哪些“中国智慧”和“中国方案”?在全球湿地协同保护中,中国又将如何展现大国担当?中新社“东西问”就此专访北京林业大学生态与自然保护学院教授张明祥。
现将采访实录摘要如下:
中新社记者:什么是湿地,湿地保护对于地球生态有怎样的意义?
张明祥:今年6月1日起实施的《中华人民共和国湿地保护法》明确,湿地是指具有显著生态功能的自然或者人工的、常年或者季节性积水地带、水域,包括低潮时水深不超过六米的海域,但是水田以及用于养殖的人工的水域和滩涂除外。
航拍苏州虎丘湿地公园。泱波 摄湿地与森林、海洋一起并称为地球三大生态系统,具有涵养水源、净化水质、调节气候、维护生物多样性等多种生态功能。人类择水而居,文明因水而兴,足以说明湿地对人类生产、生活的重要性。
被誉为“地球之肾”的湿地,是淡水资源的主要来源。据统计,中国可利用淡水资源总量的96%都存在于湿地。从这个角度来讲,湿地的重要性更是毋庸置疑。不仅如此,占全球陆地面积6%—8.6%之间的湿地,储存了全球大约40%的已知物种,因此湿地也被称为“物种基因库”“基因超市”。
此外,湿地还是地球上最重要的碳库之一,在减缓全球气候变化方面的作用非常明显。以泥炭地为例,它只占地球陆地面积的3%,却存储了30%的陆地碳,是森林碳储量的2倍。如果湿地受到破坏,就会从“碳汇”变成排放二氧化碳的“碳源”,加速全球气候变化。
江苏省盐城市东台市条子泥滩涂景区内的麋鹿。近年来,东台市生态环境持续改善,麋鹿种群和鸟类数量逐年增加,成为各种动物的理想栖息地。张连华 摄中新社记者:中国的湿地分布呈现什么特征?
张明祥:中国幅员辽阔,造就了丰富的湿地类型,从寒温带到热带,从平原到高原,几乎涵盖《湿地公约》所有湿地类型,也孕育了多姿多彩的湿地生物。比如,滨海湿地分布在东部沿海,沼泽湿地主要分布在东北地区、青藏高原,河流、湖泊湿地主要分布在长江及淮河中下游、黄河及海河下游等水资源比较丰富的地区。
位于西藏拉萨市北郊的拉鲁湿地国家级自然保护区,总面积超过12平方公里,被誉为“拉萨之肺”。何蓬磊 摄目前,中国湿地面积达5635万公顷,居亚洲第一位、世界第四位,以占全球4%的湿地,承载着世界五分之一人口对湿地的主要需求。
中国湿地还是世界水鸟的重要繁殖地、越冬地和候鸟迁徙的停歇地,途经中国的候鸟迁飞路线达4条。如新疆巴音布鲁克湿地是天鹅的重要繁殖地,江苏盐城沿海滩涂是世界上最大的丹顶鹤越冬地,江西鄱阳湖是世界上最大的白鹤越冬地,在此越冬的白鹤占全世界总数的95%以上。
一群野生丹顶鹤在江苏盐城国家级珍禽自然保护区芦苇丛上空飞过。李根 摄根据第二次全国湿地资源调查统计,中国湿地高等植物约200科692属2315种。全世界雁鸭类有168种,中国湿地就有54种,约占32%。全世界鹤类有15种,中国就有9种,占60%。
总体来说,由于中国人口众多,人均湿地面积仅占全球人均水平的五分之一左右,所以湿地资源还是比较稀缺的。
中新社记者:从1992年加入《湿地公约》至今,中国在湿地保护方面做了哪些努力,取得了哪些成就?
张明祥:最直观的,中国公众对湿地的保护意识有了大幅提高,对湿地的概念更了解,对其重要性认识也更深刻。现在,大家不仅对湿地耳熟能详,并有了保护意识。建设各类湿地公园,能让民众真实感受到生态保护带来的幸福感和获得感。
江苏省盐城市,中国黄海湿地博物馆内展出的动物标本栩栩如生,吸引民众参观。泱波 摄其次,湿地保护在中国已上升至国家法律层面,管理体系更加完善。《中华人民共和国湿地保护法》今年6月1日正式实施,从逻辑性、全面性、系统性来说,填补了中国生态系统立法的空白,确立了湿地保护的基本原则,在全球层面来看也是最完善的立法。另外,全国28个省(区、市)先后出台了湿地保护条例和办法,共同构建起湿地保护管理顶层设计的“四梁八柱”。
重庆市梁平区双桂湖国家湿地公园,景色美丽。刘辉 摄中国湿地保护体系由湿地类型国家公园、湿地自然保护区、湿地公园三部分构成。现有国际重要湿地64处,国家重要湿地29处,建立了901处国家湿地公园。30年间,中国完成了三次全国湿地资源调查,并依此在各地建立湿地调查监测野外台站、实时监控和信息管理平台,为湿地保护提供了强有力的科技支撑。近十年来,中国累计实施湿地保护修复项目3400多个,新增和修复湿地80多万公顷。
世界上真正在全国范围内进行湿地基础调查的国家很少,中国在这方面的成绩有目共睹。近日,中国印发了《全国湿地保护规划(2022—2030年)》,明确了未来一段时间中国保护湿地的目标和蓝图。我相信,有了国家的重视,湿地保护的明天会更加美好。
中国履行《湿地公约》30周年成就展在武汉举行。张畅 摄中新社记者:中国在全球湿地保护工作中贡献了哪些“中国智慧”,为其他缔约方提供了可借鉴的“中国方案”?
张明祥:中国加入《湿地公约》后,认真履行公约义务,积极参与全球生态治理,不断提升湿地保护管理水平。《湿地公约》认证的43个“国际湿地城市”中,中国13个城市入选,是全球入选城市数量最多的国家,直观反映了中国在全球湿地保护方面的贡献。
鄱阳湖畔的江西省南昌市高新区鲤鱼洲五星白鹤保护小区,成群候鸟翩翩飞舞。鲍赣生 摄再如,全世界仅有两国为湿地立法,中国是其中之一。《中华人民共和国湿地保护法》从生态系统角度进行立法,突出了湿地在生态文明建设、以及在维护生物多样性方面发挥的重要作用,对提升国际话语权、彰显大国责任担当具有重要意义。
目前,我们已经把《中华人民共和国湿地保护法》翻译成英文,也将通过此次大会,向世界各国代表及湿地保护领域的专家,宣介中国湿地保护立法成果,给其他国家提供一个范本,希望可以引领全世界对湿地保护的立法行动。
2022年11月5日,《湿地公约》第十四届缔约方大会在武汉东湖国际会议中心开幕。邹浩 摄此外,中国的湿地保护,并不是只看那些野外的、天然的、大面积的湿地,而是梳理资源、分析状况、针对性提出保护方案。而且很注重处理人与湿地的关系,湿地公园就是中国独创的一种把湿地保护与利用相结合的一种形式,在国际社会也引起很大反响。
2018年,中国起草的《小微湿地的保护和管理决议草案》在《湿地公约》第十三届缔约方大会上顺利通过。小微湿地独特的生态功能,得到国际社会更为广泛的关注和认同。
同时,中国还与多个国际机构和组织在湿地野生动物保护、湿地调查、湿地自然保护区建设以及人才培训等方面进行了合作。通过承办一些援外培训班,向广大发展中国家传输中国湿地保护经验,中国湿地保护修复先进技术和成功模式。中国还提出要加强候鸟栖息地的保护,有效保护了途经中国的4条候鸟迁飞路线,为候鸟提供安全舒适的家园。
在山东省青岛市胶州湾海洋公园河套段滨海湿地,成群的红嘴巨鸥和灰斑鸻、宾鹬等候鸟在水面翔集。王海滨 摄中新社记者:全球湿地协同保护对于构建人类命运共同体有何意义?
张明祥:湿地与人类的生活息息相关,自古以来,人类就懂得择水而居的生存方式。“桑基鱼塘”体现了中国古人在湿地保护与合理利用上的智慧。
浙江省湖州市南浔区和孚镇,星罗棋布的千年桑基鱼塘系统与盛开的桑树相映成趣。陆志鹏 摄尽管当前湿地保护、修复已成为全球共识,但是由于气候变化和人类不合理的开发利用等原因,全球湿地都面临面积萎缩、功能退化和生物多样性下降等问题,给各国经济和社会发展带来不利影响,加强湿地保护与管理已刻不容缓。
“珍爱湿地,人与自然和谐共生”是《湿地公约》第十四届缔约方大会的主题,同时也寄托了人们对未来美好生活的愿景。珍爱湿地,是全人类共同的责任,通过地区和国家层面的行动及国际合作,能有效推动湿地保护与合理利用,为实现全球可持续发展作出贡献。(完)
受访专家简介:
北京林业大学生态与自然保护学院教授张明祥张明祥,北京林业大学生态与自然保护学院教授、国家林草局自然保护区研究中心秘书长。1994年毕业于山东师范大学自然地理专业;1997毕业于中国科学院长春地理研究所湿地生态专业,获硕士学位;2003年毕业于中国科学院东北地理与农业生态研究所环境科学专业,获博士学位。中国较早从事湿地保护的专家学者之一,国家湿地保护法起草专家团队负责人,从事湿地保护与管理的科学研究和生产实践等相关工作。
(文图:赵筱尘 巫邓炎) [责编:天天中] 阅读剩余全文() |