在大家感叹微信小程序让手机变“轻”了的时候,有一群AI科学家在努力让你使用手机的效率更“高”。

你可曾想过,不用扫描二维码,不用调出app, 不用退出聊天界面,你就可以和朋友速度挑选好饭店和电影,然后叫车赴约?

这些,通过chatbot(聊天机器人)就可以帮助你实现。 chatbot和微信小程序有着异曲同工之妙,从某种意义上来说,两者都在试图减少app使用过程中不必要的繁琐。 用张小龙的话来说,是一种“用完即走”的极致用户体验。

举微信公开课上查公交车时间的例子来说,使用传统的app,用户需要打开手机,在五花八门的app中找出公交车查询的app,然后搜索相应的公交路线;使用小程序,用户只需要扫描一下二维码;而使用chatbot,用户可以在聊天平台(比如微信)上@公交搜索的app,输入“下一班550的时间”,软件机器人就可以根据当前时间和手机位置返回公交车的时间。

小程序可能更侧重于“弱连接场景”,比如通过二维码实现人与物品的连接。而在短期内,chatbot会更加侧重于简化已有的服务,把一些已有的app逐渐移植到聊天平台中来,从而避免了退出聊天再逐个寻找app的麻烦。

而通过ChatFlow提供的chatbot设计平台,你能实现的功能远不止这些,一切取决于你的脑洞有多大。

今天,驻西雅图的密探就带大家独家专访KITT.AI的联合创始人姚旭晨和陈果果,走近他们在2016年11月新发布的ChatFlow和其背后的人工智能技术。

ChatFlow是一个提供开发chatbot的各种模块的软件平台,同时具有多轮对话追踪能力。开发者登陆后可以自由选择需要用到的模块,像画流程图一样将各个模块串好,辅以对应的代码,简单调试后就可以进行部署。

(在ChatFlow提供的可视化图形界面上,每一个chatbot的功能一目了然。这对管理复杂的chatbot系统非常有帮助。)

“我们的软件就像是乐高。我们为开发者们提供积木,让他们发挥自己的想象力,去做自己想做的东西。” 姚旭晨坦言自己的初衷是为开发者们服务,ChatFlow最受开发者们欢迎的正是内置的debug功能。

ChatFlow与传统对话系统最大的不同之处在于,它的对话管理器 支持并发,并能智能地判定用户意图。

传统对话系统的典型例子是电话问答系统:按1选择英文,按2选择西班牙文,进入下一级菜单后需要按*返回上一级菜单,按#结束输入。整个系统就是一个有限状态机,用户体验并不好。

而ChatFlow则能让用户在任何时候说任何事,其内置的自然语言理解模块负责判断意图,并交给对话管理器跟踪对话进程,管理上下文。 目前,用ChatFlow做出来的chatbot还局限于比较小的场景,搜索空间也在可控范围。拥有无限场景的对话系统仍是大公司的天下,比如微软Cortana宣称可以问她任何事(“ask me anything”),但用户期望过高往往导致体验并不尽如人意,这也是ChatFlow极力避免的事情。

(KITT.AI创始人 姚旭晨)

从姚旭晨分享的ChatFlow的一些 应用场景 ,我们可以一窥开发者各式各样的需求,也可以想见其更多的应用空间:

有人用Facebook Payment做一个交停车罚单的机器人,有人针对企业内部新员工培训做onboarding bot,有人想把自己的手机App转换成bot,还有电子葬礼网站打算做聊天机器人。出于保护客户的隐私考虑,KITT.AI一般只会从注册邮件里大概获知开发者的需求。

ChatFlow目前支持Alexa, Facebook Messenger, Kik, Skype, Slack, Telegram和Twilio,已经拥有了超过两千多位客户。

在姚旭晨看来,初创企业可分为两类:一类重技术不重产品,一类重产品不重技术,这在人工智能领域尤其明显。 “我们认为作为一个企业,做产品还是最重要的。我们自己的产品里,大致七成是在做基于软件工程的产品,三成是在做基于人工智能的技术。”

16年,公司获得了Founders’ Co-op与Amazon Alexa项目的种子轮投资,也收到了Madrona Venture Group的投资。 公司目前在积极准备融A轮。

那么,是什么让KITT.AI从竞争激烈的人工智能同类型产品里得到投资人和开发者的青睐呢?

让开发者自定义热词检测,轻松唤醒对话机器人

KITT.AI与很多做chatbot的初创公司不一样的地方是,KITT.AI同时拥有制作对话机器人所需要的其他技术: 用来做热词检测的Snowboy,以及用来做自然语言理解的NLU技术。

Snowboy着重解决的是“热词检测”这个小而复杂的问题,并提供给开发者一套工具让他们自定义热词。

“热词”又叫“唤醒词”,是一个用来唤醒监听设备的单词,比如常用的“Alexa”和“OK Google”。其难点是算法必须在设备终端运行,不能切入云平台。因为一个7x24小时监听的设备要保护用户隐私,只能做本地处理,而不能将音频流联网进行云端处理。

热词检测常常位于基于语音的聊天机器人的最前端,只有机器检测到唤醒词后,才会开始执行人类指令。热词检测的主创者陈果果向密探解释了设计的挑战难度,“热词检测既要做到准确无误,又要保证不误触发。我们写了自己的深度学习运行库,并把它压缩到不超过2MB的嵌入式设备上运行,同时还需要保证留给终端设备足够的CPU资源去运行其他的任务。”

热词检测有一个长久以来的用户痛点:用户想自由自在地用任何词唤醒他们的对话机器人。 然而,在Snowboy之前,这个问题一直没有很好的解决方案。有的用户会简单制作一个击掌检测器(clap detector),就像很多中国居民楼道里用的声控电灯一样;亚马逊在他们的第一版树莓派上运行的Alexa设备上则强制用户用一个按钮去“按醒”机器人。

Snowboy出现后,立马受到开发者的欢迎。发布半年后,已经有超过5000名开发者使用Snowboy,用15种语言自定义了3000多个热词。Snowboy的GitHub代码每天都有超过100个独特用户克隆使用。

NLU着重解决的问题是单句的语义理解。比如,当用户说“给我讲个关于码农的笑话吧”,NLU能理解用户的意图是听笑话,主题是码农。但是大部分的日常对话不是一句话就能解决的,大都需要多轮问询并确认才可以。ChatFlow内置的对话管理器能够极好地追踪上下文。

“结合ChatFlow和NLU,开发者可以建立 基于文本 的自然语言多轮对话系统,再结合Snowboy以及相应的语音识别API,开发者就可以实现 基于语音 的自然语言多轮对话系统。”KITT.AI的联合创始人陈果果解释道。

很多大公司和高科技创业公司都有自己做chatbot的一套做法,但这只能让公司内部的人熟练使用。 让更多的开发者即使不是AI专家也能制作聊天机器人,将整套方法大众化是KITT.AI和ChatFlow致力于解决的问题。 开发者能够在KITT.AI网站上找到详尽的文字说明和YouTube视频教程。

备受投资人青睐的团队里都是AI科学家大神

14年,姚旭晨从约翰霍普金斯大学博士毕业后来到西雅图,加入了由Paul Allen创办的艾伦人工智能研究所(Allen Institute for Artificial Intelligence,简称AI2)的孵化器,随后创建了KITT.AI。姚旭晨在读博期间“灌水”无数,曾有人统计2012年到2016年期间,在自然语言理解和机器学习的6大会议(ACL, EACL, NAACL, EMNLP, NIPS, ICML)上,姚旭晨的论文发表数位居前10位。

15年,陈果果和Kenji Sagae作为联合创始人加入团队。博士毕业于约翰霍普金斯大学的陈果果,曾在Google实习两次,也曾参与了微软深度学习框架CNTK的开发。他参与制作的“OK Google”热词检测雏形,如今用在了超过一亿台安卓和Google Home设备上。他还与同学在美国高级情报研究计划署的混响空间语音识别比赛中拿到第一名。

团队的顾问Kenji Sagae曾是美国南加州大学教授,研究自然语言解析和对话系统,并教授了“人工智能”和“自然语言处理”这两门课。他也是姚旭晨2009年在美国实习时候的导师。

16年,团队请来了在谷歌做Neural Machine Translation的TensorFlow专家曹原,以加强公司在NLU方面的实力。曹原是姚旭晨和陈果果读博时候的同学,博士毕业时,有多篇机器学习方面的论文,学术成果显著。

(从左至右为KITT.AI团队成员:姚旭晨、曹原、陈果果)

KITT.AI作为一个SaaS(Software as a service)平台, 商业模式是客户买license,授权使用,然后收取单笔费用。 这种模式在人工智能领域有不少先例,比如最近阿里云人工智能ET入职饿了么担任调度员,实现智能派单并确保效率最优,这是继交通、空管、货运之后,ET的第四份调度员工作,背后都是利用这种license授权服务。

KITT.AI希望未来可以在云端驱动机器人,帮助客户与各开放平台融合

ChatFlow和Snowboy既可以在云端,也能在嵌入式设备上运行。KITT.AI希望有一天能将两者结合,运行在嵌入式设备上,真真正正驱动实体机器人,而不是寄居于网站或者App里的软件机器人。拥有大白不是梦想!~