向善而生的AI助盲,让AI多一点,障碍少一点******
有人说,盲人与世界之间,相差的只是一个黎明。在浪潮信息研发人员的心中,失去视力的盲人不会陷入永夜,科技的进步正在力图给每一个人以光明未来。
AI助盲在人工智能赛道上一直是最热门的话题之一。以前,让失明者重见光明依靠的是医学的进步或“奇迹”。而随着以“机器视觉+自然语言理解”为代表的多模态智能技术的爆发式突破,更多的失明者正在借助AI提供的感知、理解与交互能力,以另一种方式重新“看见世界”。
新契机:多模态算法或将造福数以亿计失明者
科学实验表明,在人类获取的外界信息中,来自视觉的占比高达70%~80%,因此基于AI构建机器视觉系统,帮助视障患者拥有对外界环境的视觉感知与视觉理解能力,无疑是最直接有效的解决方案。
一个优秀的AI助盲技术,需要通过智能传感、智能用户意图推理和智能信息呈现的系统化发展,才能构建信息无障碍的交互界面。仅仅依靠“一枝独秀”超越人类水平的单模态人工智能比如计算机视觉技术还远远不够,以“机器视觉+自然语言理解”为代表的多模态算法的突破才是正确的新方向和新契机。
多个模态的交互可以提升AI的感知、理解与交互能力,也为AI理解并帮助残障人士带来了更多可能。浪潮信息研发人员介绍说,多模态算法在AI助盲领域的应用一旦成熟,将能够造福数以亿计的失明者。据世卫组织统计,全球至少22亿人视力受损或失明,而我国是世界上盲人最多的国家,占世界盲人总数的18%-20%,每年新增的盲人数量甚至高达45万。
大挑战:如何看到盲人“眼中”的千人千面
AI助盲看似简单,但多模态算法依然面临重大挑战。
多模态智能算法,营造的是沉浸式人机交互体验。在该领域,盲人视觉问答任务成为学术界研究AI助盲的起点和核心研究方向之一,这项研究已经吸引了全球数以万计的视障患者参与,这些患者们上传自己拍摄的图像数据和相匹配的文本问题,形成了最真实的模型训练数据集。
但是在现有技术条件下,盲人视觉问答任务的精度提升面临巨大挑战:一方面是盲人上传的问题类型很复杂,比如说分辨冰箱里的肉类、咨询药品的服用说明、挑选独特颜色的衬衣、介绍书籍内容等等。
另一方面,由于盲人的特殊性,很难提取面前物体的有效特征。比如盲人在拍照时,经常会产生虚焦的情况,可能上传的照片是模糊的或者没有拍全,或者没拍到关键信息,这就给AI推理增加了难度。
为推动相关研究,来自卡内基梅隆大学等机构的学者们共同构建了一个盲人视觉数据库“VizWiz”,并发起全球多模态视觉问答挑战赛。挑战赛是给定一张盲人拍摄的图片和问题,然后要求给出相应的答案,解决盲人的求助。
另外,盲人的视觉问答还会遭遇到噪声干扰的衍生问题。比如说,盲人逛超市,由于商品外观触感相似,很容易犯错,他可能会拿起一瓶醋却询问酱油的成分表,拿起酸奶却询问牛奶的保质期等等。这种噪声干扰往往会导致现有AI模型失效,没法给出有效信息。
最后,针对不同盲人患者的个性化交互服务以及算法自有的反馈闭环机制,同样也是现阶段的研发难点。
多解法:浪潮信息AI助盲靶向消灭痛点
AI助盲哪怕形式百变,无一例外都是消灭痛点,逐光而行。浪潮信息多模态算法研发团队正在推动多个领域的AI助盲研究,只为帮助盲人“看”到愈发精彩的世界。
在VizWiz官网上公布的2万份求助中,盲人最多的提问就是想知道他们面前的是什么东西,很多情况下这些物品没法靠触觉或嗅觉来做出判断,例如 “这本书书名是什么?”为此研发团队在双流多模态锚点对齐模型的基础上,提出了自监督旋转多模态模型,通过自动修正图像角度及字符语义增强,结合光学字符检测识别技术解决“是什么”的问题。
盲人所拍摄图片模糊、有效信息少?研发团队提出了答案驱动视觉定位与大模型图文匹配结合的算法,并提出多阶段交叉训练策略,具备更充分的常识能力,低质量图像、残缺的信息,依然能够精准的解答用户的求助。
目前浪潮信息研发团队在盲人视觉问答任务VizWiz-VQA上算法精度已领先人类表现9.5个百分点,在AI助盲领域斩获世界冠军两项、亚军两项。
真实场景中的盲人在口述时往往会有口误、歧义、修辞等噪声。为此,研发团队首次提出视觉定位文本去噪推理任务FREC,FREC提供3万图片和超过25万的文本标注,囊括了口误、歧义、主观偏差等多种噪声,还提供噪声纠错、含噪证据等可解释标签。同时,该团队还构建了首个可解释去噪视觉定位模型FCTR,噪声文本描述条件下精度较传统模型提升11个百分点。上述研究成果已发表于ACM Multimedia 2022会议,该会议为国际多媒体领域最顶级会议、也是该领域唯一CCF推荐A类国际会议。
在智能交互研究方面上,浪潮信息研发团队构建了可解释智能体视觉交互问答任务AI-VQA,同时给出首个智能体交互行为理解算法模型ARE。该研究成果已发表于ACM Multimedia 2022会议。该研究项目的底层技术未来可广泛应用于AI医疗诊断、故事续写、剧情推理、危情告警、智能政务等多模态交互推理场景。
眼球虽然对温度并不敏感,但浪潮信息的研发团队,却在努力让盲人能“看”到科技的温度,也希望吸引更多人一起推动人工智能技术在AI助盲、AI反诈、AI诊疗、AI灾情预警等更多场景中的落地。有AI无碍,跨越山海。科技的伟大之处不仅仅在于改变世界,更重要的是如何造福人类,让更多的不可能变成可能。当科技成为人的延伸,当AI充满人性光辉,我们终将在瞬息万变的科技浪潮中感受到更加细腻温柔的善意,见证着更加光明宏大的远方。
为分到“糖”吃,民进党派系内斗“刀刀见骨”******
【环球时报报道 记者吴薇 王琪】由蔡英文一手主导的“行政院”改组,在1月31日画上了句号,但民进党内部不同派系间的2024“卡位战”,或许才刚开始走向白热化。纵观新“内阁”的人事安排,最明显的就是“派系共治”和“派系平衡”,但即便几大派系能够“雨露均沾”,“政治分赃”依然是民进党内斗不变的主题。而不择手段的权力斗争,只会让岛内民众对民进党“只为权力,不为发展”越来越失望。
四大派系“都有糖吃”
先来看一下这次台“行政院”改组,各派系分到的位子:英系的陈建仁出任“行政院长”,“行政院副院长”是新潮流系、但与英系交好的郑文灿,属于“正国会”派系的前基隆市长林右昌出任“内政部长”。部会副首长层级,也基本上延续了该路线,像“涌言会”的阮昭雄出任“侨委会副委员长”,新潮流系的前台北市议员梁文杰任陆委会副主委。用台媒的话说,“各派系都有糖吃”。
上文提到的就是目前民进党内的四大派系。1986年该党创立之际,由在野政治人物与地方人士结合而成,各有其不同的政治理念,随后逐渐演变成派系。其中新潮流系的前身为1983年成立的“党外编辑作家联谊会”,可以说,“先有新潮流,后有民进党”。英系在2016年蔡英文当选后成立,以“小英之友会”为主体,代表人物包括陈建仁、高雄市长陈其迈等。“正国会”成立于十几年前,以“立法院长”游锡堃为代表,主要政客包括刚出任“内政部长”的林右昌等。“涌言会”于2016年由亲绿的三立电视董事长林昆海主导组成,俗称“海派”,以“立委”王定宇为代表。民进党还有一些小的派系,比如以前“行政院长”苏贞昌为首的苏系,代表人物是他的女儿、“立委”苏巧慧等。
各派系内部还有小的派系。前“立委”邱毅2月1日告诉《环球时报》,新潮流系内分为“南流”和“北流”,前者就是以赖清德为代表,“北流”是以郑文灿为代表,与蔡英文关系更为密切,而蔡英文也通过拉拢郑文灿制衡赖清德,分化南北流。此外,还有一些已消失的派系,像美丽岛系成立于1984年,以民进党前主席施明德、许信良等人为代表,1996年后逐渐没落。
2006年7月,民进党全代会通过解散派系的提案,要求立即禁止以派系名义设立办公室、招募会员、收受会费、对外募款等,党职人员和公职人员任职期间应声明退出派系。台北驻日代表谢长廷成立的“福利国连线”就是在此时解散的。这份提案被视为冲着新潮流系而来,但该派系随即转到台面下,成立“台湾新社会智库”,继续培养接班梯队。
新潮流系不像英系等围绕特定核心人物,也不像其他派系只需缴纳一次会费,而是每个月依据职务缴纳固定费用,从助理幕僚的几百元新台币到“立委”、市长一个月上万元,这些钱成为其维系人员培养、选战布局的经费,也是其成为民进党实力最强派系的“秘诀”。“甚至比对敌人更狠”
民进党自成立以来就一直实行“派系共治”,各路人马不时结盟,分食“政治蛋糕”。像英系在2016年选举前势力较弱,因此选择与当时党内第二大派系“正国会”结盟。闽南师范大学两岸一家研究院名誉院长王建民2月1日在接受《环球时报》采访时称,民进党内派系斗争是长期存在的一种政治文化,对权力分配至关重要,所以尽管陈水扁当年还废除派系,但没有从根本上改变派系存在发展的现实。他直言,“谈论派系,其实也是在谈论民进党内部的政治权力分配和斗争”。以2020年“立法院”为例,在民进党61席“立委”中,只有6人没有派系背景,新潮流系人马最多,有18人;其次是英系的14人;第三大派系“正国会”有9人。
“有必要这么急吗?”“4年前被你做掉,这次就是要把你做掉,不然要怎样!”2018年12月13日下午,大门深锁的台南市议会民进党党团办公室尽管不让媒体靠近,但办公室内的呛声、激烈的争吵声,仍然从门内传了出来。当天,台南市议会民进党党团甲级动员,讨论正副议长选举人选推举事宜,结果大家吵成一团,气氛火爆。最后,以时任副议长郭信良为首的非主流派7名议员愤怒地拂袖而去,走出会场时还不断痛骂“蛮干,太鸭霸了”。事后,郭信良与国民党、无党议员联盟结盟,经过两轮投票惊险当选议长。
为了分到“糖”吃,民进党各种党内选举往往杀到“刀刀见骨”,比这刺激的情况有很多,岛内媒体经常提起的就是2019年民进党党内初选,英系人马为了让蔡英文出线,操控网军大举攻击新潮流系的赖清德,逼得赖清德在记者会上不断“求饶”。
还有一些内斗是在台面下进行的。2021年3月,“涌言会”的民进党“立委”王定宇被爆多次出入同党美女发言人颜若芳的住处,疑有婚外情,两人都声称是房东与房客的关系。一时间,王定宇成了众矢之的。事后有媒体爆出,背后恐涉及民进党内派系斗争。前“立委”李俊毅称,有可能是新潮流系要保现任台南市长黄伟哲,而出手修理王定宇,这件事之后,王定宇要选台南市长大概就没机会了。一名匿名媒体人也在脸书粉专质疑王定宇的料是谁爆的。他说,一般这种婚外情被爆料绝大多数出自原配,但感觉王太太并不知情。联想到绯闻男女主角都是民进党的人,“除非自己人,否则很难获得相关信息;即使是媒体记者,若不是非常信任的自己人,也不会知道”,所以“爆料者只剩下一个可能,就是民进党自己人”。
王建民对《环球时报》记者回忆起苏贞昌和谢长廷当初争夺党内候选人的情景。他说,两人斗争非常激烈,相互辱骂,除了政治攻击外,用的一些污蔑性语言“前所未见”,甚至比对敌人更狠。再比如,赖清德曾被蔡英文网军“修理”,他这次出头后第一时间就清除了蔡的智囊洪耀福,“这才是赖清德复仇的开始”。不过邱毅提到,蔡英文掌握行政机器,控制情报单位,英系可以收集证据放给媒体曝光,并用财税调查吓阻企业金主金援赖清德。
本质就是“分赃”
“派系共治”被民进党视为赖以稳定的“基石”,陈水扁曾在接受采访时称,他担任党主席时就有解散派系的声音出现,也通过了提案,但“派系解散不了”。
不过,一些派系被认为“前景不妙”。一是苏系,以前苏贞昌还能靠“行政院长”的权位维持苏系,现在将面对后继无人的处境。二是英系,该派别高度依赖蔡英文个人,也最大程度地分享蔡英文带来的“政治红利”。一旦蔡英文2024年卸任,本就组织松散的英系将不可避免地走向衰落,原来的不少成员为了各自的政治前途将纷纷改投新主,重新寻找政治靠山。所以蔡英文才会拉拢陈建仁入党,壮大英系力量,避免提前跛脚。
不择手段的权力斗争,只会让岛内民众对民进党“只为权力,不为发展”感到失望。王建民说,如果矛盾不能调解缓和,中间的浅绿选民肯定感到失望,抛弃民进党。联合新闻网1月30日称,“派系共治”向来是比较斯文的说法,其本质与“分赃”差别不大,蔡当局美其名曰要组成“战斗内阁”来迎战2024年选举,但从“阁员”名单看,“充其量不过是透过资源分配来安抚党内各山头,潜台词是谁也别想造反”。《中国时报》称,从去年“九合一”选举以来,民进党选情处于危急状态,派系抢资源肯定抢破头,稍有闪失就会打破派系平衡,蔡英文寻求表面平衡的布局,恐引发更糟的失衡,进而冲击2024年选情。
不过,民进党向来把冲突表面化。岛内政治学者赖岳谦2月1日在接受《环球时报》采访时称,新潮流系虽然在民进党内占据主导地位,但是由于民进党的玩法,他们基本上不会赢者全拿,“是拿大块的,他们走分赃政治”,这也就是为什么民进党内部权力斗争很激烈,但大家都会留一条后路。蔡英文也曾在胜选后声称,“民进党可以竞争,但竞争结束了就是团结”。对于2024年选举,国民党仍要保持高度警惕。
(文图:赵筱尘 巫邓炎)