首页 人工智能

搜狗CTO杨洪涛:开放AI听写服务比只开放技术更具挑战性

【TechWeb】8月29日,近日搜狗正式开放了AI录音笔听写服务,并和纽曼、索尼等录音笔行业头部企业成立AI创新联盟,这样手持索尼、纽曼等品牌录音笔的用户,也可以通过PC和手机APP直接使用搜狗提供的语音转文字等AI服务。

QQ图片20190829190225

搜狗CTO杨洪涛在接受媒体采访时表示,搜狗开放“听写服务”,而不是“听写技术”,搜狗是要把语音听写技术转变成一个完整的服务提供给合作伙伴,开放服务为商业化带来更多前景,也对搜狗技术、服务能力提出了更高挑战。

开放听写服务 激活传统录音笔的AI功能服务

报告显示,中国录音笔销量2015年全年是425万台,2016年是431万台,2017年是432万台,行业进入增长迟缓,趋于饱和状态。同时传统录音笔产品功能比较单一,很多场景下录音笔功能已经被手机替代了。

杨洪涛介绍,去年3月份搜狗发布了录音翻译笔产品并在市场上获得了不错的反响。基于搜狗录音翻译笔搭载的AI技术服务能力,如超强的收音、准确转写、更丰富的场景服务等,搜狗希望把这些AI服务赋能给传统录音笔,让所有的录音笔都能轻松成为一款AI产品。

QQ图片20190829190229

据杨洪涛介绍,搜狗开放听写服务后,可以为市场上90%以上的录音笔产品提供接入服务,让所有有需求的用户享受“录音1小时,出稿5分钟”的体验。

这也就意味着,目前录音笔存量市场中的大部分产品不需要升级、换新,就能用上AI服务。

杨洪涛表示:“搜狗的聚焦点是做优秀的AI技术,优秀的AI服务。我们的合作伙伴会有聚焦在硬件的定义、硬件的销售、硬件技术的研发,我们希望结合为一体,能够做出未来一代新的产品,都希望叫AI录音笔,成为一个新的体验。”

开放服务比开放技术更具挑战

同时,杨洪涛也强调:“搜狗开放听写服务,不是业界又来了一个开放平台,又是一个技术接口的API,索尼、爱国者利用搜狗的API做一个语音识别的软件,不是这样。搜狗而是把这个技术转变成一个完整的服务,把服务提供给合作伙伴。这个服务背后有新的商业机会,如果给用户转文字转得准,在文字内容生产上能产生更多新的价值。”

搜狗AI交互技术中心总经理王砚峰补充表示,之前大家都一股脑的做技术开放平台,但是技术开放平台本身如果跟客户的使用场景融合不足够,优化深度也不够时,技术就变成一种鸡肋。让技术在客户使用的场景当中有更好地适配能力,同时有更好的销售能力,并且还能够在传统的行业中打通从销售到使用的各个环节,这对于包括搜狗在内的很多做AI技术的公司来讲是不得不经历的挑战。未来的AI赋能一定是越做越重,而不是越做越轻,因为很难从轻的过程中找到你的不可替代性,以及找到对这个场景独有的优化性。这是搜狗做听写服务,不只是做听写技术的原因。同时需要把配套做起来,把配套做起来有了好的从技术到服务体系的支撑,才能把更多更好的合作伙伴吸引过来。

此外,谈到听写技术和服务未来的发展时,杨洪涛认为,让收音能力增强是录音笔一个非常重要的工作,利用AI技术做声音阵列的前端,相信未来会有更多这方面的注意和补充。

另外,王砚峰认为,听写技术的自纠错能力也非常重要,当多项技术做串联的时候,比如从听清再到转写,需要中间有强大的能力对上一环节的技术进行纠错,不是前一个系统是80%的准确率,下一个系统是80%的准确率,这两个准确率乘起来就是60%了,就不可用了,所以后面的系统怎么能够“吃掉”前面的错误,这也是需要不断增强的技术。

官方微博/微信

每日头条、业界资讯、热点资讯、八卦爆料,全天跟踪微博播报。各种爆料、内幕、花边、资讯一网打尽。百万互联网粉丝互动参与,TechWeb官方微博期待您的关注。

↑扫描二维码

想在手机上看科技资讯和科技八卦吗?

想第一时间看独家爆料和深度报道吗?

请关注TechWeb官方微信公众帐号:

1.用手机扫左侧二维码;

2.在添加朋友里,搜索关注TechWeb。

手机游戏更多