【环球网科技 记者 林迪】日前,在第四届世界互联网大会上,搜狗带来了唇语识别机器——面对摄像机时,系统可以通过分析唇部运动来“读取”听不到的语音,即只动嘴不出声,机器就知道你想表达的意思。
图:不惧谷歌和百度 搜狗发力AI智能语音 推唇语识别机器
加上搜狗在2016年世界互联网大会上展示的同声传译,这预示着,搜狗将专注于完善语言处理技能。这也成为其向更广泛的人工智能应用领域进发迈出的关键一步,即使面临美国在该领域相对领先的强大对手——谷歌。
据悉,在一年前,牛津大学人工智能实验室科学家、谷歌 DeepMind 团队共同开发了英文唇读系统LipNet。
为让搜狗更懂你
12月4日晚,作为一家以搜索和输入法为主要业务的企业当家人,搜狗首席执行官王小川在接受采访时,对为什么频频发力语音人工智能做出回应。
王小川称,搜狗有两个核心产品,一个是搜索引擎,一个是输入法,但随着社会的发展,人们使用互联网习惯的变化,现在机器翻译等会变得更加有用,语音人工智能在搜索方面大有想象力。
“现在很多人认为,语音搜索已经足够方便了,但这还不够智能。”王小川称,比如你搜索一下,搜索引擎给你的答案都是相近或者一样的,只是一堆链接,但真正厉害的是给你一个更懂你的‘答案’。”
“这个‘答案’和普通搜索出来的答案不同,它来源于机器在自然语言里面产生阅读能力,是更细、更颗粒度的,这也是搜狗AI往下发展的方向。”王小川说。
他指出,“人工智能技术的应用,将解决互联网时代连接的瓶颈,从‘解决信息的流动和不对称’走向‘帮助用户进行判断决策’,为人类的发展提供更多机会。”王小川称,按照这个方向,搜狗做AI的核心是语音,然后用它辅助搜索和输入法。“我们现在一直在推进,并取得一定的成果。比如唇语翻译机器;另外还在关注脑电波技术。”
离婚咨询将是搜狗检索法律咨询业务的首要问题
搜狗还在升级其同声传译系统,为翻译的声音输出增添“情感”。报道称,搜狗在语言处理方面的研究得到了大量汉字输入的支持,据该公司数据显示,用户每天平均创建3亿多条语音输入。
卫生保健和法律咨询是搜狗在语音激活查询服务的两个新领域,目前,还没有提供每个领域申请商业化的具体时间表。
“我们确信,未来的机器将有助于人类做出决策,我希望很快能看到互动式搜索结果成为咨询意见的那一天。搜狗还在努力提高医疗和法律咨询的搜索结果,从提供信息到提供咨询,最终咨询。”它介绍称,离婚咨询是对搜狗进行法律检索的首要问题,其次是财产纠纷和事故索赔。
“不差钱,还比竞争对手更有优势”
在采访中,王小川表示,“上述领域属于搜索业务的扩展服务,有一天他们可能会成长为一个用户群,但我们并不急于从中赚钱。人工智能的发展是一场‘马拉松’。”根据该公司的招股说明书,搜索引擎和相关广告收入占据了搜狗收入的近90%。
除了背靠腾讯和搜狐这两棵大树外,今年11月份,搜狗上市筹集了5.85亿美元。虽然搜狗上市后股价一度处于低迷状态,但王小川表示对搜狗股价有长期的信心,“我不关心这个下降,因为在搜狗上市不到一个月的时间里,美国投资者没有足够的信息来充分了解我们的业务运作。”
搜狗的搜索和输入法在AI的应用上有着天然的优势,商业化上也有着巨大潜力。对于与百度在AI上的竞争,他认为搜狗有三个优势:一是竞争对手确实做得不够好;二是有一些跨代领先的技术;三是和搜狗的一些核心能力匹配,“只有这三件事情同时满足的时候,我们才能重新定义搜索,比竞争对手做得更好。”
对于搜狗AI人才的储备,王小川说,“我们不会像一些创业公司一样,靠砸钱去声明自己有多高的能力,搜狗更多的还是业务需求。另外,像清华等高校,搜狗也有联合实验室,通过这种运作,能够吸引一些年轻且有活力的人才不断加入。”
对于目前竞争激烈人工智能领域,王小川表示非常自信,“和竞争对手相比,搜狗只有他们十分之一甚至更少的人,但取得的实际应用创新突破是更多的。我们看到竞争对手每年都宣布新战略,但我觉得,每年换一个战略方向的企业,没有什么让你害怕的地方,而搜狗的战略方向却很清晰。”