“AI+”时代,产品经理能力模型

2018年08月03日 人人都是产品经理


近日,由人人都是产品经理与腾讯大讲堂联合主办的2018中国产品经理大会深圳站完美落幕,科大讯飞华南研究院执行院长、讯飞易听说总经理 刘舒做了“AI+时代,产品经理能力模型”的主题分享,并引发探讨:整个AI行业的产品经理从业者,应该具备哪些能力模型?enjoy~

本文为2018中国产品经理大会深圳站嘉宾分享整理总结

未经许可,禁止转载。谢谢合作


———— / BEGIN / ————


分享嘉宾:讯飞易听说总经理 刘舒



以下内容为嘉宾分享实录,由人人都是产品经理社区@Daisy依据嘉宾分享内容整理,编辑有修改:



16年我曾提到,互联网时代的“流量暴利”已经消失了,所以当时提出了“互联网+行业”这个命题。


回顾一下这两年多的发展,我们可以看到这样的命题实际上是成立的。


最近两年多,那种因暴利连接的产品其实已经是消失,取而代之的是垂直细分行业里生根的一些企业。其中,我们最重要的是要对行业知识进行一些理解,从而提升它的效率。


而人工智能就是在“互联网+行业”的过程中引发出来的新一轮革命。


到了2018年,人工智能实际上已融入到了我们生活中的方方面面。


所以,今天我也是希望结合这两年多的一些从业案例,以及对人工智能的一些思考,在此跟大家做一个主题分享《“AI+”时代,产品经理能力模型》,主要分为三个部分:


  1. AI时代的来临

  2. AI的前世今生

  3. AI产品经理的三大能力模型


一、AI时代的来临


1. 从国家层面上来看


无论是美国,还是中国和欧盟,都陆续发布了有关人工智能的国家战略;对于互联网来说,这是一个很重要的事件:



2017年7月20号,国务院发布了新一代人工智能的发展规划,这是国务院首次以行政规划的方式发布产业发展规划。


从这一点上可以看出:中国正在以举国之力抢战AI的制高点。


2. 从行业层面上看


大家可以看到:无论从国家还是从行业的层面上,AI都已经到来。



无论是麦肯锡,还是科学杂志、德勤,以及埃森哲的一些报告,大家都纷纷预言:人工智能在未来会更多地取代人类现有的一些工作,并且使得人类社会的生产效率变得更高。


对此,大家也感到了一些担忧,比如就业率会进一步地下跌——或者说失业率会进一步地上涨。


3. 从生活层面上看


AI并不仅仅停留在国家层面和行业层面,也融入到了我们生活中的方方面面。



从上图我们可以看到,AI现在确实很火。


而对于想要从事AI的产品经理来说,该抓哪些重点呢?


首先要了解AI技术的发展演进历程,包括它的一些技术原理和技术边界;只有这样,我们才能更好地去设计产品。


所以,我们先看下AI的前世今生。


二、AI的前世今生


AI其实并不是这两年才出现的,它很早就诞生了,但是为什么到这两年它才开始火起来呢?


1. AI的诞生与AI的成长


在1965年Dartmouth会议上,当时四个图灵奖的得主聚集在一起提出了十大问题,标志着AI行业的诞生:



自此之后,AI一共经历了三次浪潮:



70年代和90年代,由于算法结构及当时的计算能力因素,在当时行业的应用上、效果上,都没有达到一个很有效的效果,所以前两次浪潮都是潮起潮落。


随着这个深度学习的出现,历史上的一些问题得以被解决,且取得了超前的好成绩。比如语音识别、图像识别等,都比传统算法有更好的实用效果。因此,我们遇到的AI才变得实用,从而带到生活中。


所以,我们认为这一次是人工智能真正到了爆发的时候。


那么,什么是深度学习?


接下来,我就会用一些简单直观的例子,对深度学习做一个详细分解:


首先,深度神经网络本质上是一个分类器,它是模仿人的感知过程。



如上图,这是一个简单的深度神经网络。从左往右看,整个深度神经网络是一个函数(F就是一个函数),左侧的“1”和“-1”,我们称为输入的特征或者输入的向量;右侧的“0.62”和“0.83”,我们称之为它输出的一个结果。


在这个案例当中,“0.62”和“0.83”实际上是属于不同分类的概率——相当于图像识别中的“这个是男人还是女人?”。


那么,证明他是男人的概率为0.62,她是女人的概率为0.83。


所以,深度神经网络就是:每一个输入经过深度神经网络的运算后,最后得到它在不同分类的概率;而它的本质就是输入一个特征向量,即“1”和“-1”。


换言之,通过深度网络的逐层运算,最终得到该向量属于不同类别的概率。


至于如何定义这个类别?


  • 比如语音识别:属于哪个中文字?属于哪个发音?这些都是分类;


  • 比如人脸识别:是男是女?他年纪多大?这些都是分类;


  • 比如自动评测:它得多少分?他得100分还是得0分?这也属于分类。


所以实际上,深度神经网络的核心就是解决一个分类的问题。

那么下面我们怎么来使用这个深度神经网络?


它一般分为三步走:


操作步骤1:准备标注数据


第一步,我们称之为叫标注数据。


刚才这个神经网络当中,进行逐层计算的时候,中间都有很多参数,那么这个参数是怎么得到的?


举一个数字识别的例子:假设我要识别一个图像,它里面写了0~9这十个数字。如果这个图片的像素点上有值,我就认为它是“1”;如果没有颜色,白色就认为它是“0”。


这样一来,我就把一个图像变成了一个向量——比如它是16×16,那么就是X1到X256。


我会事先准备一些数据,再交给机器去学习,我会事先选出标准“2”。



拿出来后,我告诉这个机器,它的输出是什么呢?


比如说我准备的标准是“1”,它的输出属于“1”的概率是100%;那么它属于其他数字,比如说2345等,它的这个概率为0,它不可能是其他的数字——所以我会准备大量的数据。


操作步骤2:训练网格


准备完这个数据以后,我就拿进去,我们称之为“训练”,即“训练”这个网格。



我们准备了大量的手写体“1”的各种变形、“2”的各种变形、“0”的各种变形……这些是图像,每一张图像我们都把它转化成向量(特征),然后把特征输到这个网络里面(右侧为输入);输出我也是跟机器讲好了,比如说第一排的这个数字,无论他怎么写,最后我认为它都是“1”,属于“1”的概率是100%,属于其他数字概率是0;第二行,所有的这种手写的方式,我认为它都是“2”——相当于把这样的输入和输出,明确地告诉机器,去训练这个网格。


在训练的过程中,需要的训练数据集是非常之大的。


比如在语音识别中,要大量的标注人员准备差不多10^11这么多的语料。而要解决某一个问题,比如说语音识别,要这么多的数据量;解决肺部结节的图像自动诊断,又需要这么多的数据量……每一个领域都需要这么大数据量,要提前输入到计算机里面,然后训练好这个网格——所以在做AI的时候,这个成本是巨大的。


操作步骤 3:使用网格


训练好以后就很简单了,这个网格就可以叫人工智能,就可以拿来用。



如上图,这个时候我再拿一个图片进来(事先不知道是几),我把它的特征抽出来后,用这个网格一算,最后得出:


  • 属于“1”的概率是0.01(几乎不可能);


  • 属于“2”的概率算出来是0.99(可能性很大);


  • 属于“0”的概率是0.01(几乎不可能)。


这样逐层算下来后,最后我们认为这张图片就是“2”——实际上,这个网格就可以解决数字识别的问题。


以上就是关于深度神经网络的一个简单直观说明。


2. AI的现状



如上图,我们可以看到整个AI发展的三个阶段:


第一个阶段:计算智能。大数据和云计算技术的出现,使得计算智能机器已经远远超过人类,比如说Alpha Go;


第二个阶段:感知智能。由于深度学习的出现后,人工智能目前已经在大部分的领域能媲美,甚至超过了人类;比如在语音识别、图像识别等领域。


第二个阶段:认知智能。这是最重要的一个阶段,认知智能就是人区别于万物最核心的一个点,比如动物也是有感知的,也能分辨这个是不是能吃的,也能做一些简单的分类。


那么,这三者的区别在哪?


我们实际上认为:人类区别于动物最重要的是想象。


什么叫想象?就是人类能创造一些根本不存在的东西。


比如:


  • 什么叫胜利?

  • 什么叫失败?

  • 什么叫沮丧?

  • 什么叫神明?


这些概念实际上是人创造出来的——通过这种想象出来的概念去凝聚人类,共同去完成一个目标。


目前这个人工智能还没找到有效的一些模型;因为目前整个人工智能的发展,更多的是技术在人们已有的一些计算框架下,通过一些仿真学的一些方式,然后让它的效率变得更高。


因此,我们认为:目前人工智能的发展还处于前两个阶段,即计算智能和感知智能阶段——已经媲美,甚至是超越人类,但在认知领域是有待突破的。


最近这两三年,感知智能在深度神经网络出现以后,取得了飞跃式的发展。


那么在感知智能的应用上,目前已经在哪些领域里面已经非常实用了?


如下图:



我们简单地分析了算法的机理,下面我就会结合它的一些特征,然后继续分享:在这样的一个技术框架下,我们产品经理应该具备哪些能力,才能够区别于互联网的产品经理,从而在AI这个领域取得更好的一些成果?


三、AI产品经理的三大能力模型


基于AI的一些特有性,我们来分享一下关于AI产品经理的三大能力模型:


能力1:对AI技术边界的认知


第一个能力模型很重要, AI产品经理一定要对AI的技术边界要有很强的认知——因为你对所在行业技术边界的认知,直接决定了你设计产品的应用场景。


如果你对AI技术的认知深度不够高,那么你设计出来的产品要么没人用,要么就累死开发——所以AI技术是一个很重要的特征,这是基于概率体系。


也就是说,所有的输入和输出不是一个确定性的结果。


比如我一个手写的“2”,对于一般的人理解,这个肯定是“2” ;但是对于计算机,对AI引擎来说,它输出的是概率,如:


  • 输出属于“2”的概率是多少?

  • 输出属于“1”的概率是多少?

  • 输出属于“0”的概率是多少?


而且有些时候还会犯错——最后输出的结果,可能属于“1”的概率比属于“2”的概率还大。


这个颠覆了我们原来传统做软件、做互联网的思维。


举个例子:


在语音识别这个领域,我们的识别准确率在过去十多年是低于95%的。这时候,我能用这个概率去作会议记录吗?


这个是不行的——100个字里面错5个字,甚至可能有些关键字都错了,这个东西不实用。


但是在哪些地方能用呢?比如说K歌的评分,辅助的文字输入——这种偏娱乐性,对准确率要求不高的一些场景下面,我们就可以使用。


再举一个大家耳熟能详的例子:


在图像识别领域,前两年特别火的是什么?猜年龄,或者看你长得像哪个明星?——为什么当时这类型应用特别火?因为当时的图像识别准确率比较低,比如说是低于95%;在这种技术边界下,我们只能做一些娱乐型的设计。


最近两年的发展,在一些特定场景下,我们的准确率能提高到95%以上,甚至是99%。这项人工智能技术,由于它的边界前移了,往后也提升了,所以使得它的应用场景就变得更加宽阔了。


比如现在的安防身份认证,包括用微信领公积金,都是用人脸识别作为密码,这个的原因在于:人脸识别的准确度,我们经过十多年的努力达到了技术边界。



这个是很典型的一种场景:


作为互联网软件的产品经理,你对开发说的一句话肯定走到他桌边,说:“哎,这个功能要多久实现?”


开发说:“可能要两个月吧。”


但如果你是AI产品经理,就不能这样去问了——因为这样问就显得太业余了;而且这样的问法,这个产品肯定做不好。


那么该怎么问?


你应该说:“三个月,语音识别率能达到95%吗?”


你绝对不能说三个月时间能不能搞定语音识别,这时没有人能回答你什么叫搞定——所以,你要把这个边界提出来。


而且参与这个的开发同事肯定会这样回答:


三个月,识别率只能达到90%,而且需要标注100万条数据,需要100个标注师,如果你搞不定这些,那这个准确率也保证不了。


所以在AI时代,作为产品经理设计产品的时候,关于技术边界的认知是最重要的。


能力2:具备行业相关知识和深刻洞察


作为AI产品经理,第二个能力模型一定是要具备行业的相关知识和深刻洞察——这一点也是区别于互联网其他领域的产品经理。


互联网创造了新的行业和规则。比如「微信」这种通信方式,之前是没有的,现在创造出来了这样的一种交互方式;再比如阿里巴巴这种电商,虽然这是从外国引入进来的,但对绝大部分中国人来说,以前是没有这样的一种交互方式,所以里面的规则、操作和一些认知结构全是由互联网人全新创造的——你会感觉到天地开阔,你设计的每个功能好像全国人民都能用。


但是,AI行业并不是去创造行业和规则;恰恰相反,AI行业是赋能传统行业,然后帮助传统行业提升。



因此结合上文提到的算法结构来说:AI得有输入和输出的数据,你才能够训练你的网格。而这个输入、输出则是由传统行业里面的专家给你提供的。


所以,如果你对传统行业的认知不深,那么你是无法参与到AI行业中。


比如:


  • 自动驾驶:除了掌握互联网的技术和算法,其核心是要了解整个驾驶的机械原理,包括对交通法规的了解等。你不具备这样的一些行业基础的话,光靠AI算法是无法从事这个行业。


  • 智慧医疗:那么你得了解医学的一些病理知识、药理知识等,毕竟医疗是一个几千年的行业;


  • 智能客服:你要帮一个电商公司,或者帮一个金融企业做机器人客服,首先得对这个行业的一些话术,包括他们答题的一些规范要做一个深入的了解。


  • 智慧法院:要帮助法官去庭审、去审犯人,那么你要对法律知识足够了解才行。


所以,AI产品经理肯定比互联网产品经理更加受拘束。


大家一定是要首先理解行业,然后再运用我们的聪明才智,把AI和领域融合起来。因此,这就提出来——了解行业的痛点和技术的可切入点,1+1的模式是最好的入门途径。


什么叫1+1?


一般做AI的时候,一定是要找一个行业专家来合作——当然,这种行业专家可以是一个团队,也可以是顾问的形式。比如做教育,一定得跟很多有经验的教研人员来进行合作;做医疗,一定时和从事某个细分领域的医疗专家来进行合作。只有这样,我们才能真正提升AI产品的使用程度,也才有数据。


能力3:设计创新的人机耦合运营模式


第三点能力,我们称之为“设计创新的人机耦合运营模式”,AI时代的这个运营模式也是需要创新。


互联网时代,因为确定性的存在,所有的问题都减少了中间环节,直达终端用户,这是互联网的本质——提升效率。


但在AI时代,你不能这么去做,因为这可能会有问题:


案例1:智能客服——完整工作量降低10%,总体效率提升30%


如下图左侧的这个理想中机器人客服,用户一上来后面没人了,就是一个机器人“哒哒哒……”。但现实中由于AI技术边界的存在,这个对于语义理解的准确性还无法达到很实用。


现实生活中,我们都跟很多机器人对过话,也知道这个机器人的水平基本上就是两三岁小朋友的水平。如果你认识不到这样的技术边界,而要去设计这么一个机器人,在当前这个环境,你肯定会失败。


所以,我们提出了这样的一种方式:指针对AI领域的不完美性,通过“人+机器”一起来做。



如上图右侧的这个模型,现在的智能客服系统是这样的:用户打进来以后,把用户的行为分解成两种:导航和提问题。


你打到银行,首先银行都会先问你:“如果你要问某某某业务,请按1号键;如果你要问某业务,请按2号键……”这个就是分类,这是人工智能解决得最好的一个问题。


现在有一个语音导航,当你进来以后根据你语音识别成文字,再判断你的分类属于哪一类问题,自动帮你导航——这个接线员就不用了,而且也不需要用户一步步地操作。


当用户进来后可直接用自然语言说话,然后一秒钟就可以自己导到机器人客服;如果发现机器人理解不了客户的话,需马上自动转人工客服,这样一来就称之为叫人机耦合的创新模式。


这样的模式,已经被我们大量地应用在金融行业和运营商行业。


我们可以看到:完整的工作量降低了10%,就是说有10%的工作是完全被机器人取代了;总体的效率比原来提升30%,即通话时长节省了30%。


通过这种人机耦合的运营模式,AI才能在这个行业当中真正起到实际的效用。


案例2:医疗影像智能检测——有效降低误诊率


接下来一个案例,我们分析一下理想中的医疗影像智能检测:

比如说我们照完了肺部、乳腺等以后影像,就要判断是否得了癌症:这个结节有没有结节?有,是哪一种结节?有没有癌症也要做一些判定。


如下图左侧是我们理想中的模型:医疗这个机器人诊断医疗图像传进来,机器人给结果——但是这样的路径是错误的。因为我们是基于概率体系的,而机器人也会犯错;如果你这么去做,那跟以前的做法是一样的。


人际耦合模式是怎么做?



实际上,我们现在在医院里面合作的是右边这种模式。医疗影像上传以后,由人类的医生先看,医生把所有的图片以及诊断结果上传到云端。我们在云端部署一个叫质检的机器人。


也就是:质检机器人也来看一次,如果两者得到的诊断结果是一致,那就是pass;反之,则会让人类的专家再来仲裁。


通过这样的方式,能有效到降低误诊率,并且也非常实用。


所以,AI产品经理在设计产品时,不光是要设计功能,一定要预先考虑到产品在应用的时候,它的运营模式是什么。而你如何试用运营模式,是和你对行业的认知,对技术边界的认知,以及你的技术在行业中是否足够实用等都是息息相关的。


以上为本次演讲内容。


———— / END / ————


嘉宾PPT下载

关注人人都是产品经理微信公众号

回复关键词“大会”获取下载地址


点击“阅读原文”下载APP

收藏 已赞