吴文俊人工智能科学技术奖 智能语音对话机听觉感知专题论坛

发布时间:2022年05月10日
       4月10日, 由我国人工智能学会颁布的我国智能科学技能最高奖“吴文俊人工智能科学技能奖”十周年颁奖盛典在北京揭晓。在人工智能天然科学奖的5个一等奖中, 仅有的语音相关奖项花落上海交通大学。取得该奖项的作用名为“鲁棒语音信号形式剖析与辨认的深度结构化建模理论与办法”, 由上海交通大学核算机科学与工程系副教授、思必驰上海交通大学智能人机交互联合实验室副主任钱彦旻领衔的研讨团队完结。在4月11日举行的2020我国人工智能工业年会主论坛上, 思必驰联合创始人、首席科学家, 上海交通大学教授俞凯带来了题为《闭环学习与言语智能》的主题陈述, 共享了关于未来人工智能办法论的考虑与实践。思必驰联合创始人、首席科学家、上海交通大学教授俞凯4月12日, 由我国人工智能学会主办, 姑苏工业园区协办, 我国人工智能学会吴文俊人工智能科学技能奖评选基地、智博天宫、上海交大、思必驰承办的“智能语音对话及听觉感知专题论坛”在苏拉开帷幕。
       本次论坛由俞凯教授担任论坛主席。北京工业大学教授鲍长春、哈尔滨工业大学教授韩纪庆、我国科学院教授王岚、中科院声学所教授颜永红、清华大学教授郑方、姑苏大学教授周国栋以及思必驰-上交大联合实验室副主任、上海交通大学副教授钱彦旻等智能语音信号处理及听觉感知核算方面的闻名专家一起到会, 就现在语音、对话及听觉技能研讨的机会、现状、展开、工业落地及未来应战等多个方面做深化剖析和讨论。北京工业大学教授鲍长春鲍长春教授共享了《根据语音相位估量和声源空间特征的语音增强办法》陈述, 介绍了三种根据语音相位估量和声源空间特征的语音增强办法, 即根据深度神经网络和相位批改函数的单通道语音增强办法、根据深度神经网络和相位解环绕的单通道语音增强办法和根据声源空间特征和语音相位信息的多通道语音增强办法。探求了声源空间特征在多通道语音编码和增强上的使用。哈尔滨工业大学教授韩纪庆韩纪庆教授共享了《杂乱环境下声学事情检测与场景辨认》陈述, 要点介绍了非语音感知与了解方面的研讨, 首要触及声学事情检测与场景辨认, 将剖析其展开进程、面临的困难与应战、相关作业的研讨展开, 以及团队所展开的作业等。
       我国科学院教授王岚王岚教授共享了《人工智能使用于言语重塑与恢复》陈述, 表明针对言语妨碍问题, 可使用虚拟三维说话人技能仿照发音运动, 使用于听障儿童和孤独症儿童的言语练习和恢复;使用机器学习和人工智能技能展开构音妨碍的语音主动评价和检测;使用多使命言语特征展开前期认知妨碍检测和分类等。经过整合视觉和听觉模态信息, 树立多模态交互的学习环境以进步言语妨碍者的言语沟通和沟通才能。中科院声学所教授颜永美女永红教授共享了《语音技能在家电职业使用的机会与应战》, 共享了对当时人工智能热的考虑以及对语音职业在家庭使用的观点, 讨论语音技能面临的应战, 并对或许的进一步展开进行讨论, 对怎么展开语音使用给出主张并简略介绍中科院言语声学与内容了解要点实验室在语音研制和使用方面的探究。清华大学教授郑方郑方教授共享了《声纹辨认的录音重放进犯检测办法》陈述, 表明常见诈骗声纹辨认的办法别离为人声仿照, 声响转化, 语音组成, 录音重放和对立进犯。其间, 录音重放简单施行、作用传神, 对声纹辨认系统发生巨大要挟。
       为检测录音重放进犯, 研讨者提出根据语音随机性、应战呼应、多模态和重放失真的检测办法。在重放失真检测方面, 研讨者从信号、特征、模型等多个方面下手, 提出了多种失真检测计划。其间从信号层下手, 研讨重放导致的信道实质差异, 可更好对不知道进犯进行检测。姑苏大学教授周国栋周国栋教授共享了《多模态情感剖析研讨》陈述,

有用地交融多模态的特征然后精确地进行情感剖析, 一直以来是多模态情感剖析研讨的要点和难点。该陈述首要针对三种多模态情感剖析使命:独白中单标签情感分类, 独白中多标签心情分类, 对话中单标签心情分类。并就此别离提出有用的解决办法:根据情感相关词挑选战略的多模态情感剖析办法、根据模态和标签依靠的多模态多标签心情辨认办法、根据上下文和说话者信息的多模态心情辨认办法。
       思必驰-上海交大联合实验室副主任, 上海交通大学副教授钱彦旻钱彦旻教授共享了《鲁棒的语音信号形式剖析与辨认》陈述, 钱教授表明语音技能在实践使用过程中,

面临“实战化”的实在杂乱语音信号, 语音数据的随机性和数据来历的多样性, 会极大起伏影响语音处理系统功能。本陈述介绍结构化的语音深度学习建模办法,

经过模型的结构化规划和优化, 有用改进语音技能在实在杂乱场景下的鲁棒性。因在学术立异性上的作用, 所提出的相关理论和办法也取得了2020年吴文俊人工智能天然科学奖一等奖。
       论坛最终展开了尖峰对话, 针对“用语音对话革新人机交互的现状, 机会和应战”这个主题深度讨论。未来, 跟着信息技能和机器学习办法的不断进步, 以及互联网和物联网的推行和遍及, 以语音为进口的人机交互技能变得越来越重要。语音对话及听觉感知技能也逐步成为学术界和工业届的一个新研讨热门和使用趋势。