Monday, April 30, 2018

AlterEgo:用内心声音控制电子部件

本文内容取自MIT Technology Review的报道--Say Goodby to Alexa

现在的新技术很多都容许人用声音来启动电子器件的机械操作,而Arnav Kapur的AlterEgo让你用思想来转换电视频道等等。

按照MIT的项目介绍,AlterEgo是一种闭路的可穿戴部件,它允许人用无声交流的方式对机器,人工智能助理,电子服务,和其他人,发出指令信号。用户无需开口出声,也不需要作出外部可观察到的动作,只要借着内心的有意发言,好像对自己说话,就可以进行高带宽自然语言交流。

可穿戴部件捕捉到电子信号,这些信号是由内部语音发音器(当用户故意在内部发声)细微而有意的移动引起的。MIT的媒体技术研究人员用这种方式来促成双向自然语言计算处理。 从今以后,控制电子产品将能够不开口啦。

由MIT媒体实验室研究生Arnav Kapur所创建、名为AlterEgo的部件原型已实现了这一目标。 Kapur的部件是一个三维打印出来的塑料小产品,看上去好像一根贴在头上的瘦白色香蕉 –让用户可以翻转电视频道,改变灯泡的颜色,下棋,计算复杂的算术等等,都不用说一句话,也不用举手。 AlterEgo可以让人们彼此默默沟通,并且不至于互相影响。 Kupur描述自己制作项目时的体验,觉得自己有些像个电子人,不过是最理想的那种。

AlterEgo并不会知道你心里想的一切,尽管听起来好像如此。 它在我们静静地阅读或与自己交谈时,会抓住由面部和颈部肌肉的小动作产生的微小电信号,通过蓝牙发送到计算机,在那里借着算法进行解码,然后行动(例如“开灯”)。 这系统用骨传导耳机给你反馈,并用电脑声音让你知道其他的AlterEgo配戴者想告诉你的东西,却不必塞住耳朵。 那种感觉就像自己被连接到互联网上一样。Kapur说,没有了它,人会突然感到正常。

在一个人工智能快速进步的时代,机器人接管或杀死我们,至少会夺掉我们的饭碗,这类焦虑越来越大。Kapur却看到,AlterEgo在某种意义上解除这些焦虑。 他去年花功夫制作这个部件,显示出AI是帮助人的工作,而不是取代人。

他把AlterEgo看为一种新的电脑,比起在智能手机上敲打,或对Alex发令,它用起来比较不费力,而且比较亲密(安静)。 虽然它现在只是一个初期的原型,但Kapur认为这很有用,比如帮助叫一个优步车辆,或者帮助讲话障碍和听力障碍的人更容易沟通。

到目前为止,Kapur和其他几位媒体实验室的研究人员已经建立了好几个简单的应用程序,其中包括帮助国际象棋和围棋的赛手,提出下一棋步,或解决一个算术问题,让你得到内部声音的答案,甚至可以让你成为物联网上的一个节点,提供的准确数据给你。

研究人员还让人测试了AlterEgo作为默默无闻交流的工具的有效性。根据最近的一篇论文,他们发现平均有92%的机会,AlterEgo能够准确地捕捉用户心里说的话。

康奈尔大学副教授Tanzeem Choudhury负责管理该学校的人群感知计算实验室,她认为AlterEgo可能对于讨论某些事情,对一些可能令人感到尴尬,或情绪感到困扰的谈话特别有帮助。

她说,挑战在于让部件运行良好,而不会使硬件和互动的本身看起来奇怪。 她指出谷歌眼镜 – 一个原型失败的例子-说明当有人头上戴了小工具时,人们之间的互动会受影响而出错。

Kapur想要改进并出正式的产品,现在已开始考虑所有必须首先解决的问题。例如,它的人际交流功能仅限于非常简单的单词和短语:“是”,“不”,“你好”,“再见”和“你知道吗?”虽然它可以静静地从英语翻译成西班牙语和日语,它仍然只能翻译15个短语。

这是因为他对沉默言语解读的方法是新的,不像典型的语音识别,我们没有大型数据集可供研究人员用来训练AlterEgo的算法。 所以,研究人员正在借着让人们使用AlterEgo来建立沉默语言的数据集。

Kapur说,他们还在医院和康复中心开展了一项研究,让那些有语言障碍的人使用AlterEgo,不过他不肯透露具体的内容。 此外,研究人员正在扩展系统可以理解的词汇,开发应用程序,并考虑如何改进AlterEgo的外形。

No comments:

Post a Comment