底层的交互技术变化了以后,所有的上层的建筑,都会发生变化。因为底层技术的变化,发生了结构性的变化。自然交互、对话交互来颠覆现在我们看到的图形式的交互,这是我们思必驰目前看到的机会。
上周五,在苏州黑马路演中心的开业仪式上,思必驰科技战略VP郭浩然就当前的人工智能创业机会谈了谈自己的看法。
以下是他的演讲内容:
思必驰是园区的一家做语音的公司,其实不是一家新兴的创业公司,它在创业的路上已经走过了十年。
我是2015年年底的时候来到思必驰的,但是思必驰之前,我自己也是一个创业者。
对我来讲,我看到了比较多的智能驱动的创业泡沫。从短的来说,有互联网金融,有智能硬件,有O2O,从比较接近市场的变化的角度来看,其实它在现在目前所处的阶段,多多少少也存在一些资本所驱动的泡沫。
最近大热的互联网金融
对一个创业者来讲,在资本泡沫的时点上,对我们做的事情要有更加深入,更加冷静的一些思考。
从思必驰的角度看人工智能,其实并不是特别地完整,因为我们毕竟是一家做人工智能领域的一个人机交互的一家公司。从人机交互的角度来看人工智能,更多地有技术因素的视角。
其实人工智能并不是一个非常新鲜的话题。在座的小伙伴们,也应该多多少少有一些了解。
50年代的时候已经有人工智能的概念提出来了,就没有然后了。
到70年代,出现了一串网络,出现了神经网络的一些新的算法,让科学家,让业界,让研究界,看到了人工智能所带来的巨大的潜力。但是也是没有然后,它仍然是一个实验室的一些概念和实验室的一些小样。
我们现在目前所用到的深度学习的概念,就是在1975年的时候,提出来的。
到了90年代初80年代末的时候,已经开始有一些我们看到的所谓的人工智能商业化的雏形开始展现。那个时候我们更多地看到的是一些机器具备的智能,但是很可惜,因为数据的问题,它仍然没有很好地能完成人类预先想教给它的一些工作。
到了现在尤其是到了2015年的时候,也就是我们现在目前所说的人工智能比较蓬勃发展的阶段,其实2015年的几个标志性的事件。
阿尔法狗,它战胜了人类。
我们看很多身边的同学,如果他下围棋下的非常好,我们第一个反应是什么?是这个人非常聪明。现在不得了了,既然计算机战胜了人类里最聪明的人,我们开始受到了惊吓。
目前思必驰的客户主要集中在三个场景,这三个场景从交互的角度来讲,它都是同一点,而不是两点。
在创业的时候,我们一定要想清楚,什么东西是我们最需要的,我们客户最需要的是什么样的,我们能帮助他们解决什么样的需求。所以痛点这个词,我觉得一直要放到CEO的脑袋里,而且是处于一个最高的位置。
大家对语音,刚才讲了5项的语音技术,会提一个疑问。这5项语音技术,我大概跟大家简单地聊一聊。
第一个是语音的识别,它更多地是通过传感器的技术,把外部的声音,尤其是人们的声音转换成数据,数据在里面再提取相应他对应的文字的符号,我们目前评测的标准基本上是准确率。
广泛应用的语音识别技术
这个准确率,大家可能会提一些疑问。尤其是说很多做投资的,现在有很多开源的技术,同样准确率很高。你们怎么看这个问题?
其实我们已经提到了,对于开源来讲,很难突破90%,你想突破90%以上的话,你都需要对所有的技术,有很深的把握和掌控。同时要积累很大量的数据。
目前已经跑出来的一些厂商,他的技术门槛和数据门槛是比较高的。如果小伙伴们想在这方面去做创业的话,我觉得你可以去看一些比较细分的领域,而不是说回到最基础的技术的领域去做。这个语音技术的难度已经比较大了。
我们再看看iphone语音的进化史。
“hi siri”
从最开始的时候,已经有用户希望,我跟手机,尤其在不方便操作的时候,为什么不通过语音呢?那个时候就已经出来了。一直到siri到2015年iphone收购siri,我们目前用的应该是IOS10的siri。siri的反应和里面富含的内容,和我们之前看到的有很大的不同。这里面进化的趋势代表了什么?不知道大家有没有想过。
我现在手上拿的手机,和电脑有一个很大的相同点——它和人的交互,我们术语叫GUI图形化的操作界面。
GUI是什么意思?你会发现从40年以前,我们就有显示器,上面是黑白的,最后变成有灰度,最后变成有彩色。这里面它的本质没有发生变化,它仍然是一个图形化的展示,这些界面是受限制的。
可语音了以后,它对GUI有什么样的冲击呢?很多人会挑战,有没有什么,现在我们能看到的语音交互的方式,能颠覆现有的模式呢?
底层的交互技术变化了以后,所有的上层的建筑,都会发生变化。因为底层技术的变化,发生了结构性的变化。
比如说大众点评。我举个例子来说,我要和谁去吃饭。我定了个时间,选了个地点,选了一个餐馆。你知道我真实的需求是什么吗?其实并不知道,我是为了商务,是为了请女朋友,和同学聚餐,其实你并不知道。
但是,有了语言对话以后,你们知道用户的需求以后,你知道用户的真实的想法是什么,用现在的GUI的技术是绝对做不到的,这就是给创业者带来了一个绝好的机会。
巨头他们没有办法去关注到这一个结构性的变化,而且他的现有的优势,会成为他转型的包袱。我觉得小伙伴们,可以在这上面去不断地提高,在这上面去做一些思考。
思必驰对整个人工智能的疑点有几大板块:
第一个我们叫计算制,存储的计算。
第二个是感知和表达。
其实我们刚才说的识别,其实停留在感知和表达这里。更智能的是后面的内容,目前我们所希望的人工智能,第一个是智库,第二个是抽象思维。其实我刚才提到的问题,已经进入到了认知,之前我们所谓的GUI,其实在前两年,只是很简单的用户和机器的交互。
我们现在目前看到的这些传统的,尤其是说我们大概十年前说的一些语音的工具的产品,它更多的是什么?我们把它叫做传统的语音技术,更多的其实是键盘的替代。
你说一句话,电灯开和关,和我们现在目前正在做的,其实有很大的不同。这也是有很多人问,你们和他们最大的不同在哪里?其实就在这里。
我们是基于对话,基于刚才我们刚才说的,解决人和电脑,人和互联网,最底层的交互的一家运营公司。
我们看到的机会是说,未来会出现类似于像CUI、DUI、NUI,自然交互、对话交互来颠覆现在我们看到的图形式的交互。这是我们思必驰目前正在做的,我就不去展开了。
从交互来讲,尤其是我们看到刚才说的,如果我们要建立一套对话交互系统,来替代现在我们看到的大众点评、携程也好,通过这种参数式,和用户交互,你需要解决几个比较大的问题,其中最大的问题是我们不确定性的问题。
你发现用户说了一句话,说能穿多少是多少。他真实的表达的意图是什么?这个就是一个你有没有考虑环境的问题,考虑时间的问题,考虑气候的问题。这些东西就是我们现在目前不能带给我们的。
如果我可以通过一个CUI的技术去来解决现在问题的很多GUI解决不了的问题的时候,这里面就存在着很大的机会。
就是我刚才提到的,有没有一种模式,可以对付大众点评。那能不能再想一下,有没有一种模式可以对付携程。
携程我们选择的这种参数,因为GUI的限制很有限的。你只能选择从哪到哪,什么时间点,坐哪个车。但是你要知道航空公司的数据,光工行运营数据有200多项维度,但是携程只用了5个。用现在的GUI技术,是没有办法突破它的限制的,在现在的游戏规则下,是没有办法去实现的。
但是你利用了这种CUI的操作模式,CUI对商业模式的理解模式的话,这个你会发现非常快。当然了,你里面还存在,目前我们需要解决的很多问题,就有机会。这里不展开了。
其他的除了我刚才说的认知的问题以外的,在数据上也存在着很多这种创业的机会。
尤其是对我们思必驰来讲,我们已经有了一个很庞大的数据库。对于使用我们平台的用户来讲,我们对会把这个数据库开发出来,同时我们还会开发一套我们AIOS的这么一套开发平台,这里面其实解决了部分,这里面我们在用对话技术开发时候碰到的一些问题。
这是刚才我提到的,我们看到了这个变化的趋势,目前不单单是在手机上存在着创业的机会,在以物联网端终端为代表的新一代的,我们的人工智能网络里面,已经出现了很明确的信号。
像我们创业的话,我觉得我们可以考虑在这里面去做一些功课和调研。尤其是对我们思必驰来讲,我们在车载终端上已经突破500万的激活用户。这里面其实是非常需要很多的服务,来提供给我们的用户。比如说举个例子,我看到通过明星的形象和语音,训练出这样一个模型,这样我可以在家里面选。
比如说我希望林志玲的声音,也希望有郭德纲的声音,希望哪个我喜欢的明星的声音,这件事情,如果大家能做,我觉得我们也比较有兴趣。这就是新的机会。
刚才我们做了一个简单的总结,整个人机交互,从我们的维度上来看,有四个比较明确的特点。第一个控制,第二个对话,第三个未来具备多模态的这种交互能力,最后能达到更高级的人工智能。
目前我们处在第二个阶段,而且第二个阶段,我们看到的巨大的机会是什么?颠覆以前通过GUI构建出来的整个互联网的模式。我们现在推的,就是我们刚才已经提到了VUI的一个系统。我们给客户提供技术,打通所有数据孤岛的ID,提供我们现在目前正在比如说和携程合作,和大众点评合作,去通过目前CUI的内容。
最后我再稍微说两句,刚才已经提到了,车展已经有500多万激活用户,在机器人现在目前大概有十几万用户。还有其他的一些,这里面其实展现出来的物联网的终端,未来我们创业的小伙伴们,可以以后去做深度的思考。这里面目前我们看到的全是空白。
手机的流量现在目前一个安装用户已经到了10块钱,但是在这里,我们都是免费提供给所有的合作伙伴的,甚至有一些我们认为,有重大价值的模式,我们不光是投钱,我们还给用户做补贴。这里面是完全的一片蓝海。
最后总结两句话,第一个,我觉得创业的路是非常坚信的,思必驰坚持了十年,才迎来了人工智能这一抹春天。第二个,我们需要在智能泡沫里面,保持清醒的头脑。创业要非常深入思考的,我们的机会到底是什么。我们到底解决什么用途什么问题,哪些东西是没有巨头竞争的,是适合我们小公司生存壮大的。谢谢大家!
推荐阅读(点击下方蓝字)
创事记:程鹏 | 高始兴 | 李晓军 | 季鹏 | 刘彪 | 黄健 | 李可佳 | 陈泉 | 李文建 | 朱啸虎 | 何鹏 | 魏敦山 | 刘炽伟 | 李益明 | 鞠金友 | 罗子浩 | 马义和 | 陆海英 | 于亚楠 | 戴湧 | 夏旸 | 雷明 | 李源 | 桂曙光 | 费建江 | 张海龙 | 孙绍瑞 | 曾佳欣 | 陶闯 | 罗钥 | 施佳樑 | 夏仲璞 | 高洪偲 | 靳毅 | 刘轶 | Travis Kalanick | 王甲佳 | 林亮 | 刘彪 | 孙绍瑞 | 张泉灵 | 杨岩 | 黄俊 | 周鸿祎 | 刘川郁 | 顾刘成 | 陈刚 | 林玉峰 | 邓亚萍 | 周玉黍 | 唐元华 | 徐井宏 | 安盟 | 刘超 | 吴媛 | 余钢 | 张祥伟 | 季鹏 | 周志颖 | 黄君贤 | 王挺 | 潘伟 | 陈宇宁 | 魏晨 | 顾问 | 陈华根 | 孙绍瑞 | 毛勇 | 黄昕 | 陈琦 | 王阳 | 刘映婷 | 冯翼 | 张世民 | 江涛 | 陈正 | 孙加腾 | 吴晓梅 | 姚哲 | 周连生 | 黄丹青 | 李康 | 魏松林 | 李伟超 | 张明
活动报道:苏州黑马路演中心开业 | 比由开业 | 机器人大讲堂 | 百度云智峰会 | 第20期众创空间沙龙 | 通付盾年会 | 武汉大学苏州创客中心启动 | 天宫家宴 | 顺融家宴 | 苏股交挂牌企业路演 | 极客众创启动 | 第十届科技领军人才表彰 | 思客入启动 | 麦迪斯顿上市 | 独墅湖创客汇启动 | (苏州)数字经济与创新发展大会 | 第27期云彩路演会 | 通付盾蓝海众创空间启动 | 中美跨境创新论坛 | 2016云彩路演会季赛(二)| 园小样启动 | N度空间启动 | 海归人才创业峰会 | 第五届国赛电子信息行业总决赛 | 第七届纳博会 | 第26期云彩路演会 | 创投嘉年华分会 | GAMEBOY启动 | F-work启动 | 第25期云彩路演会 | 第三届创业博览会暨金鸡湖创业高峰论坛 | 智造邦启动 | 第24期云彩路演会 | 初心会启动 | 腾讯“云+未来”峰会苏州站 | 金鸡湖大数据产业联盟挂牌 | 腾讯众创空间(苏州)启动 | 2016新媒体投资峰会暨微众新媒体孵化器开业仪式 | 亚当智能硬创空间启动
年度盛典:荣耀金鸡湖年度盛典 | 荣耀演讲人采访 | “云领创新”圆桌论坛 | 崔晓波荣耀演讲 |“数聚智慧”圆桌论坛 | 黄一兰荣耀演讲 | 费建江荣耀演讲 | 吴志祥荣耀演讲 | 优聚思荣耀专访 | 智能公交荣耀专访 | 荣耀专访