医谷网

谷歌DeepMind“唇语识别”能力已经超越人类

来源:网易科技报道

据外媒(Gadgets)报道,人工智能技术近年来突飞猛进,微软等硅谷巨头甚至宣称其语音识别系统已经能媲美人类。现在谷歌的AI在语言理解能力上更上一层楼,不仅可以通过更好的唇语识别来帮助听力障碍人士,多语言神经机器翻译(Multilingual Neural Machine Translation)也将显着提高翻译质量。


谷歌母公司Alphabet下属的DeepMind部门和牛津大学的研究者使用新闻视频对其AI系统进行训练。用于训练的视频总长超过5000小时,语句超过118,000句。视频取材自BBC电视台自2010年至2015年间播出的节目。训练完毕后,研究人员使用该系统对今年3月~9月间播出的口语节目进行测试。测试结果发现,系统通过“观看”说话者嘴部动作便可以准确识别出整个句子。比如“我们知道这里也会有数百位记者”。(We know there will be hundreds of journalists here as well)

给予相同的视频素材,专业的唇语识别专家能够达到12.4%的正确率。而AI系统识别正确率是46.8%。

前不久谷歌开始在“谷歌翻译”中运用神经机器翻译技术,能够识别准确地识别句子而不再仅仅是单词翻译。现在谷歌宣称使用多语言神经机器翻译技术后,谷歌翻译的翻译效果将再上一层楼。

谷歌在博客中称:“我们提出的结构无需改变基本的GNMT系统,而是在开头使用一个额外的‘token’来指定所需的目标语言翻译。”除了能够提高翻译质量,新的方法还支持“Zero-Shot Translation”,即在没有已知数据的情况下,能够对没有见过的语言进行翻译。

虽然这些研究成果产生实际影响还有待时日,但不得不说这些技术创举让人十分印象深刻。

医谷链

DeepMind最近做了个能读懂唇语新软件,为失聪者提供有力工具

关注药上市微信
点击关注药上市微信

热门推荐

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季

2025-06-12

赛诺菲加速尼塞韦单抗全球发货,提前数月助力医务工作者应对今年RSV流行季
因爱凝聚 · 共愈新生 2025罕见血栓与止血疾病学术会成功举办

2025-06-09

因爱凝聚 · 共愈新生 2025罕见血栓与止血疾病学术会成功举办
医务人员学术讲课取酬的六个应当、六个严禁

2024-02-26

医务人员学术讲课取酬的六个应当、六个严禁
2023年,全国卫生总费用增速高于GDP增速

2024-09-04

2023年,全国卫生总费用增速高于GDP增速
首届重庆市预防医学会公共卫生眼科学年会暨第四届全国甲状腺眼病专家论坛圆满举行

2025-06-08

首届重庆市预防医学会公共卫生眼科学年会暨第四届全国甲状腺眼病专家论坛圆满举行