首页 人工智能

距离《钢铁侠》中的智能生活有多远?他就快成功了

《钢铁侠》中史塔克大叔的别墅,多少人梦寐以求的房子啊~

早上被智能管家“贾维斯”轻轻唤醒,遮蔽室外光线的窗帘自动打开;

语音播报着热点新闻,覆盖每寸落地窗的透明屏幕显示着天气状况;

直接对着空气说:“帮我煮一杯咖啡”,不久后咖啡就自己煮好了;

所有的电器在语音指令下打开、关闭……

人工智能出动,这生活简直不要太爽。只是,啥时候我才能住上这样的房子?

然鹅,当我们还停留在幻想的时候,有的人已经行动了!

最近网上有段视频广为流传,有人通过自己调试代码,让家里的灯能听懂人话。完全不用动开关,只需要说“把卧室的灯打开”、“把灯光的亮度调到5”,灯就会自动打开,或根据指示调节亮度,666666。

视频截图

这改造后的智能灯,不仅准确识别了指令,还敏捷快速地做出了反应。虽说市面上的智能家居已经不算什么新奇的事儿,但人家纯粹靠自己改造出来,也可以说是非常厉害了!(毕竟一个人干了一个公司做的事~)

But,录制视频的人是谁?他是怎么实现的?我们能像他一样自己开发吗?

带着满心疑惑,一番波折后终于找到了这位“改造者”。出人意料的是,他就是一位刚刚毕业的应届大学生。

他叫周施乐,心中有一腔“钢铁侠”热血,想靠自己把钢铁侠中的情节变成现实,造个属于自己的“贾维斯”出来。凑巧的是,在寻梦的过程中,他无意间接触到了百度UNIT平台,然后便一发不可收拾……

周施乐和他的“贾维斯”程序

下面是采访实录,大家可以深度感受下施乐同学的“钢铁侠梦”。

Q:先自我介绍下?

A我叫周施乐,今年的应届毕业生,现在在一家针对安防产品的公司做软件开发。

Q:为什么想要自己改造家里的灯?

A我是做软件开发的,也是顺应现在的AI趋势吧,研究点这方面的东西;另外最重要的是,我有比较强的钢铁侠情怀~我现在的唤醒词也是用的“贾维斯”,想从简单的灯开始,一步一步做下去。

Q:现在市面上已经有一些智能家居产品,为什么选择自己开发?

A哈哈,这个从根儿上说,是因为穷……虽然现在智能家居产品比较多,但价格也比较高啊!我刚刚毕业开始工作,资金也不是很多。另外自己喜欢研究编程,所以就想利用现有的互联网资源,自己造呗。

Q:什么时候开始接触编程的?又是什么时候打算自己造智能家居的?

A第一次接触编程是初三,那会儿还在写易语言,到了高中才开始转写C语言。我平时不太爱打游戏,所以有时间了就喜欢自己琢磨点东西。去年开始有这个念头,感觉电影和现实脱节太严重了,那能不能自己还原下《钢铁侠》中的场景呢?感觉很酷,很有挑战,也很有成就感,就准备行动了。

Q:有了这个想法后,你做了哪些尝试?最后为什么选择了百度UNIT?

A要想让灯听懂我说话,需要很多技术和数据支持,所以也看了挺多平台,想找个更适合自己的。我现在用的是百度语音识别+百度UNIT平台,这是我筛选一圈用起来最舒服的,特别容易上手。写这套代码的人真的很厉害,做了很好的铺垫,我利用下班的零碎时间弄,加到一起也就一天左右吧,然后就有了视频中的效果。UNIT对于想快速上手的人来说,还是非常友好的。

Q:你自己做智能家居,除了热爱还有什么其他目的吗?

A其实并没有什么其他想法,就是单纯的喜欢研究,想让计算机理解我说的话,自己造个贾维斯出来。

Q:后续的计划和打算是什么?能否举例详细说说?

A当然是一步一步还原《钢铁侠》中的场景,这是我的最终目标!目前来看的话,除了全息投影,应该都能利用百度现在开放的技术实现。比如把家里的窗帘、门、空调、电视等等,都接进来。当我走到家门口的时候,摄像头识别到我回家了,家里就自动进入到有人模式;当我要出门好几天的时候,开启安防状态,传感器变得更敏感,自动监察家里的安全情况。

应届毕业生、第一次做硬件开发尝试、调试的零碎时间加一起仅一天左右、想自己改造出电影中的场景实现“钢铁侠梦”……这是采访之后,记忆最深刻的几个关键词。

实际上,要实现周施乐视频中说话控制灯光的情景,需要的前期准备工作并不少。就像他在采访中提到的,不仅需要系统理解人类的表达及背后的含义,结合对话内容来判断当前的状态并作出反馈,同时需要基础的语言处理和分析技术。

技术和数据方面的高要求,对于普通的开发者而言,确实不是件容易的事情,更不要说是一个刚刚毕业的应届大学生。

所以,周施乐使用的百度UNIT平台是什么?具体是如何操作的?是不是任意一个开发者,都能用这个平台改造自家的家居,实现视频中的情景?

来,开始上干货!

据百度AI开放平台官网介绍,UNIT(Understanding and Interaction Technology),即理解与交互技术,它是建立在百度多年积累的自然语言处理与对话技术以及大数据的基础上,面向第三方开发者提供的对话系统开发平台。

这句话指的是帮助开发者打造“面向任务的理解与交互能力”,通俗来讲就是让物体听懂人类说话并做出回应。通过UNIT平台,开发者可以快速、灵活的按照开发者需求定制对话系统,满足智能助手、智能家居、智能汽车、智能客服、机器人等各类产品和场景,充分降低开发者的门槛。

那么,UNIT平台可以理解哪些任务?

可以是某个问题,比如今天天气怎么样、我的快递到哪儿了;

也可以是一个指令,比如:去给我把咖啡端过来;

甚至是通过一系列交互引导用户达成某项需求,比如通过注册、选座、下单完成订票。

到了实际的应用场景中,它还可以完成上述任务的组合。

UNIT平台又是如何理解这些问题的?

对于一个自然语言对话系统来说,理解的核心任务是对意图的解析和对词槽的识别。

先解释下这俩概念——

意图,指用户的目的。比如指令是“北京气温”,它的意图是“查温度”。

词槽,是满足用户意图时的关键信息或限定条件,简单说是一个筛选条件,比如查气温时,词槽就是地点和温度。再举个例子,“预定去上海的机票”中,“上海”就是一个“目的地词槽”,它会通过给系统提供必要的参数条件以保证对“预定机票”这个意图的执行。

在百度UNIT,开发者可以根据自己的需求,灵活地定义意图和词槽,再提供一定量的训练数据,UNIT便可以自动训练需求理解模型了。周施乐改造的灯也是这样实现的,当下达“把我卧室的灯打开”指令时,UNIT分析到这句话的意图是“开灯”,限定词槽是“卧室”,然后做出相应的动作。

说了这么多,UNIT平台到底能给开发者什么?

第一,百度多年打磨、积累下的理解与交互的核心技术。

在语言理解方面,UNIT提供了多种语言理解模型,包括基于深度学习的模型,来实现意图和词槽联合的识别。开发者只需要提供少量的训练数据,就可以灵活的定义自己想要的意图和词槽。

UNIT可以基于主动学习,识别出模型训练中最有帮助的样例,让模型训练过程更加高效,此外能够把已经学会的理解能力用于新的任务中。还有一些基于模板和规则的方法,作为机器学习方式的补充,便于后续更好地理解。

在交互方面,UNIT同样提供了很多技术支持。

自然语言对话不是单轮的一问一答,而是一个多轮的过程。UNIT具有多轮交互以及对话管理的能力,能够有效的管理对话的状态,并在跟踪对话状态的同时,设计动作触发的机制,让开发者可以灵活掌控交互的动作。

而当用户意图表达不清的时候,UNIT还提供了自动澄清的功能,比如“河大”到底是河北大学还是河南大学,遇到这种情况时,系统就会自动触发。

第二,从百度海量大数据中获取到自己的应用任务所需的数据。

UNIT除了提供技术的支持,还提供数据的保障。百度的大数据是一个宝库,既有海量的网页内容,也有用户搜索和点击浏览数据、各类产品的对话交互数据等。

UNIT利用这些长期积累下来的数据,汲取出对开发者最有帮助、最有价值的数据。比如,当用户输入了小规模的训练语料,系统会自动的进行语义匹配,从百度的大数据中匹配出来和你的应用最相关、最相似的数据,开发者只需要额外标注一些数据来优化模型,事半功倍。

第三,通过多种手段实现面向目标任务的灵活个人定制。

UNIT提供了多种定制化选项,开发者既可以选择上传特定的词表,注入任务所需的领域知识,也可以按照自己的需求灵活的配置交互逻辑,还可以通过提供训练数据,塑造应用所需的机器学习模型。

UNIT平台应该如何使用?

这张图是百度AI开放平台中展示的UNIT使用流程。依次通过梳理业务逻辑、配置对话单元、标注对话数据、对话训练与验证、应用调用几个关键步骤,开发者便可以实现对话与交互系统与目标业务的联动。

百度UNIT平台搭载了业界领先的需求理解、对话控制、机器学习等技术,目前,一个常见垂类(如查天气、电视检索)的对话系统开发只需几天时间,还能让零编程基础的人快速上手。据悉,百度UNIT平台已经在客服、家居、车载三大场景实现落地,成功支持了智能客服、智能家居、车载导航、智能对话等产品。

周施乐说,他会继续研究百度UNIT平台,希望借助它和百度AI开放平台的其他技术,一步一步实现自己的小目标。

你是否也有一个,还未开始行动的“钢铁侠梦”?

获取更多百度AI开放平台能力,可至百度AI开放平台官网。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多