人与机器的交互经历了 Web 与移动 app 这两种运行时,但是随着聊天机器人、会话以及 AI 这些事务代理的出现,新的人机交互形式正在出现。看看 Benedict Evans 是怎么思考未来的人机交互的。
人与机器的交互经历了 Web 与移动 app 这两种运行时,但是随着聊天机器人、会话以及 AI 这些事务代理的出现,新的人机交互形式正在出现。看看 Benedict Evans 是怎么思考的人机交互的。
聊天机器人实际上切入了两个当前的热点。一方面是在 AI 的爆发下反映出大家都希望这些东西真正能起作用;另一方面,它们提供了一种无需安装 app 即可接触用户的办法。
审视任何 AI 问题的最粗略办法之一,是问一下解决该问题是否需要 “一般 AI”,还是说问题领域足够狭窄的同时解决方案还足够宽松灵活,不用 HAL 9000(科幻小说《太空漫游》里面的超级 AI)也能处理高比例的潜在场景。也即是说,我们现在离做出可以自行在高速公路上面跑的车已经相当接近了,因为可能的高速路况范围有限,但是在罗马或者莫斯科市中心跑则完全是另外一回事,因为这需要完全不同的一种决策机制:谁知道对面的手势是什么意思呢?
因此,把 AI 植入 “会话式” 聊天机器人接口的挑战在于,你没有 HAL 9000 但却要让用户感觉你好像有的样子。你跟它将话,它就会回话,而且是用自然语言(语音或则文本的方式),但这根本就不是一般 AI。那么怎么问才能让 AI 露出破绽呢?这个破绽有多大呢?问题的领域范围究竟有多狭窄呢?如何才能定义用户对理解该领域的期望呢?或者更重要的是,你能让大家接受这个领域吗?
看待这个问题的好办法是比较一下 Siri 和 Google Now。Google Now 是基于推送的—它只是在自己认为需要的时候才说。而 Siri 则相反,别人问什么它都要回答,当然了,它也不可能永远都理解。Google Now 是靠保持安静来弥补理解的鸿沟,Siri 则是靠预先准备的笑话来搪塞过去,或者好一点,准备一份你可以提问的问题列表。当然实际的智能表现可能未必好到哪里去(你总会有不懂得),但你可以看到,Siri 是失败的。
Siri 的 “这是你可以问的” 界面基本上就是一个命令行帮助提示,但是关键是这种 GUI 设计并不需要你知道自己可以输入什么了。尽管自然语言处理意味着你不必知道 Siri 或其他聊天机器人的特定语言,但还是有一个基本的发现问题—既然我不能什么都问的话,那我可以问什么?
这些都意味着到目前为止,似乎机器人或者会话式 UI 可能最适合完成非常具有针对性的事情—用户知道自己可以问什么,并且也只能问这些。不过,一旦这种方式有效时,情况就开始变得非常有趣了,尤其是这正好跟前面提到的第二个焦点相当的匹配—避开 app 的安装问题。
说服某人安装你的 app 是个相当痛苦的过程,但是能不能通过一个会话式界面来跟你的应用进行即时、流畅、简便的互动呢?能不能把聊天机器人变成一种全的交互模式,成为继 web 和原生 app 之后的第三代的运行时呢?当然,更实际的问题是能不能找到除了应用商店以外新的办法来获得用户呢?(换句话说,就是 “管它智能不智能了,如果聊天机器人能够让我少进贡点钱给 Facebook 也行了”)