Wednesday, November 29, 2017

谷歌制造的AI产品展示

也许您已经知道或体验过几项AI产品?本文转摘自微信公众号"网易智能”的文章亚太新闻Google AI产品,全文请点击链接阅读:

11月28日上午,2017年Google 亚太新闻发布会在东京举行,本次会议的主题是Made With AI,Google Brain团队负责人、Google Research Group资深院士Jeff Dean以及Google AI软硬件产品研发的负责人发表了演讲,阐述了Google如何将AI运用到自己的软硬件产品上,以及如何与社会机构合作解决人类面临的重大问题。

Jeff Dean首先登场,他阐述了Google在人工智能领域的愿景,即通过三种途径让每个人都从中受益。这三个方面包括:利用AI使得Google产品更加实用;帮助企业和开发者创新;以及为研究人员提供工具,从而解决人类面对的各项重大挑战。

一、AI已经完全深入Google的软硬件产品:Jeff Dean表示,机器学习是Google在人工智能领域的工作重心。通过机器学习,可以极大的改善Google的产品。这些产品有:

将机器学习用于分类的软件Goolge Photos 中的照片搜索(Photo Search);Google Translate中的即时相机翻译(Word Lens)和 Google Lens;将机器学习用于预测的系统程序,如Gmail 和 Inbox 中的智能回复(Smart Reply),Google Maps 中停车难易度的图标(Parking difficulty icons);将机器学习用于理解的系统程序,例如Google Assistant,YouTube 中的自动字幕(Auto captions)和神经网络机器翻译(Neural Machine Translation)。

你尝试过在键盘上敲入“dogs"或“狗”字样来搜索图片吗?Goolge Photos是围绕机器视觉建立的一个产品,可以让用户轻松在照片库中搜索到特定照片。还有Google Translate正在利用“神经机器翻译”系统,来借着用户给的实例来改进翻译质量,这系统会随着时间的推移学习,做出更好,更自然的翻译。Google Translate是目前在中国大陆唯一能够使用的谷歌产品。

Google Lens是一款基于图像识别和OCR(光学字符识别)技术的人工智能应用,能够让机器学会“看图说话”。Google Lens能实时识别用智能手机相机所拍摄的物品并提供与之相关的内容,目前Google Lens已经综合到Google Assistant和Google Photos中。

谁尝试过Gmail的智能回复功能?据说当用户要回复邮件的时候,智能回复可以自动给一些建议的回复内容,可以加速我们的办公效率,尤其是在使用手机回复邮件的时候。

通过机器学习,Google Maps可以变成一个实用的地图,比如目前的停车难问题,Google Maps可以预测这个地方有没有停车位,标出停车难易度的图标,然后帮你导航过去。另外,通过机器学习,基于你愿意看什么节目,愿意听什么音乐,它还可以帮助用户推荐一些歌曲或一系列相关的音乐产品,这就能运用到Google Play Music上。

我的手机上有Google Assistant,它的核心技术是语音识别。比如询问Google新德里的天气是什么样的,它会通过语音识别、理解,然后以合理的形式展示给用户。Jeff Dean说,这个系统是非常复杂的,其中包含了很多机器学习的相关技术。

我尝试过一些语音的Auto captions功能,为要查看自动翻译的基础如何,目前还不够理想。但在YouTube上,现在能够通过机器学习给超过10亿的视频自动加上字幕,可以让世界上近3亿的聋哑人或者有听觉障碍的人可以看到视频上的东西。Jeff Dean称,我们还在不断的改进这个语音识别系统,使“自动字幕”的文字准确性提升了50%。通过神经网络等技术,可以让听力有障碍或者不精通视频播放语言的人通过自动字幕享受到视频。

Google研究项目总监Linne Ha详细阐述了机器学习如何帮助解决语言问题。她说,世界上有6000种语言,另外还有很多方言,这其中超过100万人以上使用的语言有400种,但是,目前网络上的内容大约50%以上都是英文,这就是用机器学习来解决语言互通的重要性。Linne Ha称,语言是身份不可或缺的一部分,谷歌想要创造一个技术,能够让更多的人联网,让不同语言的人上网更容易。

另外,机器学习技术在输入法也是非常重要的。首先是键盘,英文有26个字母,这个键盘排列很普遍,但是有一些语言有30个字母,我们通过机器学习来做预测排列方式。

其次是谷歌手写输入,Google Handwriting Input,利用机器学习可以更准确的判断手写内容。

第三还有语音输入Voice Input,在机器学习的帮助下,自然语言处理系统能够更好地理解你想说的话。语音搜索支持 119 种语言,其中包括 11 种印度语言和 3 种印度尼西亚语言。