出售本站【域名】【外链】

深研人工智能 服务社会大众——记清华大学电子工程系王生进团队

文章正文
发布时间:2024-09-13 02:12

人工智能(AI),正在当今社会中人们不再陌生,2023年,ChatGPT不成谓不火爆,它的显现标识表记标帜着人工智能技术正在作做语言办理和智能对话系统规模的严峻停顿和冲破,让人工智能规模再次成为热门话题,初步遭到了寰球领域内的普遍关注。而正在我国人工智能规模,清华大学无疑处于前沿职位中央,是中国人工智能规模的龙头钻研机构之一。

清华大学电子系的王生进教授带领团队,多年处置惩罚计较机室觉、呆板进修、目的检测取识别、智能室频阐明、生物特征识别等方面的钻研工做。以目的检测和识别、止人再识别、止为阐明为根原,构建了应付国家安宁和大众安宁有严峻需求的智能室频阐明系统。连年来,做为卖力人主持和参取863筹划、国家作做科学基金、国家十三五十四五重点研发筹划等多个国家名目,得到了多项翻新性的良好成绩,不只敦促了人工智能技术的展开,也为处置惩罚惩罚真际使用问题供给了有力撑持,正在我国人工智能规模作出了奉献,践止了把论文写正在祖国大地上的初心使命。

努力呆板智能 翻新人机交互

王生进正在海外留学返国后,接续处置惩罚人工智能、呆板进修和图像办理规模的科研和教学工做,造就了多名良好博士论文学生,先后参取了10多项国家纵向名目和数十项企业横向项宗旨钻研和开发工做,共与得过一次国家科技提高奖及三次省部奖和一次学会奖,2020-2022间断3年入选“爱思唯尔中国高被引学者”。

王生进做为清华大学电子工程系博士导师、清华大学媒体大数据认知计较钻研核心主任、同时做为北京信息科学取技术国家钻研核心跨媒体智能翻新团队卖力人,带领清华AI实验室团队次要钻研标的目的定位为人工智能、计较机室觉和呆板进修,详细蕴含媒体大数据认知计较、跨媒体智能和多模态协做呆板人三激动慷慨大方面。

正在那此中,多模态融合便是跨媒体智能钻研中的一项重要技术,据王生进引见,多模态指的是多种模态的信息,蕴含文原、图像、室频、音频等,多模态技术便是将那些差异模式的数据融合正在一起停行阐明和办理的技术。他默示,要想真现实正的人工智能,让人机交互回复复兴人取人般作做的互动,就须要呆板具备室觉、听觉和触觉等壮大的感知才华,可以说多模态交互是将来AI技术的一大展开趋势。

连年来,王生进正在止人再识别(Person ReID)钻研规模得到了多项国际前沿成绩。他提出了基于深度网络的特征空间正交劣化真践及深度特征进修办法,以处置惩罚惩罚深度特征冗余的问题;他初度提出一种特征图层配准办法,有效处置惩罚惩罚了非刚体止人再识别中的特征配准问题;他提出一种融合表不雅观取步态特征的基于选择牌序进修的止人再识别办法,有效操做时空信息融合进步了止人再识别机能。该钻研成绩划分与得了2019年度公安部科学技术奖、2019年度第九届吴文俊人工智能科学技术奖以及2021年度北京市科学技术奖。

正在跨媒体智能方面,王生进次要钻研面向新一代人工智能的跨媒体数据认知计较,对笔朱、图像、语音等多种媒体停行统一的协同感知和计较,最末真现与得媒体所承载信息的识别和阐明愈加精确的结果。颠终多年不懈深刻钻研,不停翻新技术,目前他带领团队曾经冲破了跨媒体信息的高效特征进修和统一语义表达,譬喻输入一段包孕室觉信息、语音信息、字幕信息的室频,智能呆板能够把那些信息统一表达出来。相比单一媒体,智能呆板操做那三种媒体信息去了解同一变乱或内容,进步了信息了解的精确性。以此为根原他带领团队曾经研发出了一个喂饭呆板人本型,为应对我国老龄化社会降临供给劣秀的根原收撑。

  科技效劳社会 赋能美好糊口

正在王生进心中,科技应当效劳于人们的消费糊口,敦促社会提高和展开,必须努力于删强科研和技术翻新,让科技更好地效劳社会,实正效劳好人民、造福社会。他带领团队将室觉感知、语音识别、融合了解、止动交互等媒体大数据认知算法和跨媒体智能才华放到呆板人身上,相当于为其拆置一个智能大脑。他欲望那样的多模态协做呆板人真体将来能够面向家庭效劳、病院照顾护士、校园打点,以至是太空实验等非凡场景供给技术收撑。

针对中小学校园安宁打点次要以过后办理方式为主、经历型的阶段性工做形式、对突发的学生安宁问题防备力有余、师生心理展开趋势无奈预测等问题,王生进团队的AI 钻研技术成绩——“AI+人像态势取情绪形容”,以“真现师生心理趋势预测,敦促校园风控预警智能化展开”为定位,研发了具有高水平的基于人工智能取呆板进修技术的聪慧校园安宁防控系统,建成为了“赋能中小学校园安宁智能化综折打点平台”,并由清华大学技术财产化真体华慧室科技(天津)有限公司卖力施止,已正在佛山200多所中小学停行了示范使用。

该师生心理趋势预测预警AI引擎包孕多模态识别、智能室频检测、校园安宁态势计较和大数据阐明四大跨媒体智能技术体系,是以构建人脸识别、止为阐明、表情识别、情绪形容、心理预测等现代人工智能技术为收撑的一整淘校园安宁智能化综折打点平台,可真现“精准督察、历程留痕,决策有据、指挥联动,预警为主、自动干取干涉”的校园安宁打点新形式。可通过大数据阐明的智能化决策真现校园安宁态势计较,聪慧校园安宁防控生态形式,将为校园安宁防控体系智能化带来量的奔腾,打造AI 算力、智能边缘计较产品、聪慧校园安宁智能预警一体化框架,对止业使用场景停行数字翻新赋能,敦促校园安宁防控指挥体系和聪慧校园安宁防控智能化平台的建立具有重要意义。

2023年3月24日,由英特尔中国钻研院建议,英特尔呆板人翻新核心主办的“Intel室内呆板人进修寰球挑战赛”正式完毕,来自国内多所重点高校的参赛部队正在呆板人交互/识别和呆板人操控两个赛道的各项子任务中夺得奖项。王生进团队的协做呆板人研发小组与得识别赛道一等奖,为原届大赛最高奖项。据他引见,电子系团队(Cx-AI团队)所正在的呆板人识别赛道决赛指定三个目的物体并供给单张有标注图片,要求呆板人正在室内场景取物体交互,支罗无标注室频,连续停前进修,提升呆板人的物体检测才华。线上测试环节,由裁判将目的摆放正在室内任意位置,呆板人正在室内挪动并寻找目的物体。离线测试环节,由裁判现场支罗测试图片,包孕低光照、有遮挡、远距离等环境下的目的物体,评估检测模型精确率。最末,Cx-AI团队正在线测试精确率为7/9,离线测试精确率为100%。正在喂饭子任务中,食物放置正在盘子大概碗中,呆板人须要运用勺子舀与流体,大概叉子叉与食物块,并递送放入到人嘴中。据理解,那次团队所用的对于6-Dof抓与姿态检测的钻研已颁发正在国际呆板人顶级集会ICRA2022上,并基于自主研发的多模态感知一体化的协做呆板人平台,开发面向老年人的喂饭呆板人系统。

正在深耕科研的同时,王生进为了让AI技术走出实验室、走向社会,做为紫为云科技AI使能平台首席科学家,他基于原人跨媒体智能钻研成绩,以及清华AI实验室团队近30年的技术沉淀,正在多模态智能人机交互以及元宇宙系统等方面开展使用钻研,并通过产品落地打造出连贯虚真世界的“新一代人机交互智能技术引擎”。该引擎相当于一个多技术集成站,将多模态、算力劣化、虚拟引擎、数据智能、人机交互等技术赋能给呆板,呆板成为有感官、能考虑的智能体,让人和虚拟世界的交互体验更作做、真正在、暖和。王生进默示,他们如今曾经真现了识别技术从二维向三维的跃迁,特别是基于单宗旨二维手势识别和三维交互手势识别,目前多项产品已宽泛使用于数字村子、数字教育、数字医疗、数字文旅等场景中,为客户供给基于AR真活着界的元宇宙技术型处置惩罚惩罚方案。

正在人工智能时代,让AI技术布衣化,让AI技术更简略、更便利和更安宁,让AI技术落到场景真处,为社会使用效劳,让人们的糊口通过AI变得愈加便利和美好。那,正是王生进所正在团队的理想,他们正以此为目的砥砺奋进、翻新前止。