“你说的那个,只是推送人工智能的上半场。”
顾莫杰又喝了口薄荷茶,对于陆文君没完没了的质疑已经有些疲劳了。
一个女人,在这个瞬息万变的时代,脱离前沿技术将近两年,怎么可能一夜之间,就靠枕边风补回来嘛。
喝完茶,他反问陆文君:“从我们刚提出‘给的再多、不如懂我’或者‘猜你喜欢’这些概念的时候,我们最初是怎么做的。还记得么?”
许是因为精神旺盛,陆文君回答得很快:“当然记得,不就是和我刚才说的那样么:优先训练机器人回答那些有标准答案的客观题,比如百度知道上已经有经过审核的正确答案的题目。
然后再轮到那些百度知道上还没有答案、但是有人问、咱用专门雇佣的回答问题团队找资料、回答、审核、上传——我记得你那年两-会的时候,为了推动中国铁塔的成立,为了给移动和电信被淘汰下岗的人找工作,不就弄了个人工智能中心,吸纳了十几万人专门答题、训练客服型人工智能么。”
顾莫杰总算有些欣慰,妻子的水平还没因为育儿而彻底还给老师。至少她怀孕之前已经知道的事情,至今都还记得。
“对,就是这样。那种人工智能,只能优先回答客观题,也就是有标准答案的题目。很适合当客服,当热线接线员,因为客服要回答的问题都是逻辑性很强的,很容易排查标准答案——
你不说我还忘了,从移动电信挤出来那十几万人,咱三、国家七,养着他们训练了两年,如今公司的客服型人工智能成长非常快,现在已经可以拿给各地的运营商、银行、机关衙门、法院进行测试了,估计年底就能通过验收。
明年开始,这些机关和事业单位就不用再在公务员招聘考试的时候招客服和接线员了。这两类人的工作,会永远在公职系统内被消灭。目前已经混进公务员和事业编的客服,已经够他们将来作为机器人客服的补充,用到死了。
再过一年,这个进度可以蔓延到相当一部分的企业单位客服人员。”
顾莫杰把这些信息和妻子说了一下,才发现自己扯远了,赶紧回到刚才的话题上。
“前面说了,让机器人‘听得懂’一切用人类语言提的问题、并且准确回答其中那些有标准答案的客观题,这就是深度学习算法对问题回答型人工智能的训练的上半场。
然后,从去年下半年,搞定nhn之后,咱的问题回答型人工智能已经发展到下半场了,严磊和他的研究院,如今天天就忙那些。只不过你在休产假,没了解罢了。”
“具体给我说说嘛,人家真不想脱节前沿太久,被人以为没见识。”陆文君的技术宅妹属性,也算是天生的了,并不是为了赚钱才对数理内容好奇的。作为顾莫杰的妻子,她绝不希望自己在生意上辅佐丈夫的价值就此终结。
“这个下半场,就是:当客观题部分,采用公用的大数据池训练完毕后,主观题部分,我们要依靠对每个用户细致入微的行为分析,来做到私人订制的‘初秘’。
也就是说,数年之后,每个‘初心’手机上的‘初秘’机器人,在回答各自主人提出的主观题时,答案是不一样的。这里面再也不依靠‘大样本容量的统计’来实现偏好筛选,而是完全按照每个人的喜好量身定做。”
陆文君歪着脑袋想了想:“每个人都根据自己本身的行为数据来揣测,那岂不是一开始很不准?那些不愿意配合、不愿意把行为习惯隐私泄漏给初音的用户,我们岂不是很难有进展?何况单个个体产生的数据频次太低了,很难通过聊聊几条信息分析出一个人的喜好啊。”
顾莫杰摆摆手,示意陆文君不必担心。
“你不懂里面的技术原理,就别瞎担心。这是一个循序渐进的过程。比如,我举个例子,就拿看书而言,曾经我们是把用户分成几个大类,有的用户爱看玄幻,有人爱看都市,有人爱看历史。然后他看哪类比较多,就把这一类最火的书推给他——这是最原始的弱智状态,都称不上人工智能。
第二步,当他有限地看了几本书之后,大致可以摸清这个人的脾胃。然后根据和他行为模式类似的人,按照‘人以群分’的算法,推而广之认为他和哪类人是一样的,把那一类人都比较爱看的东西推送给他。
如果他接受了,那么就留下一个喜好的数据烙印,如果他拒绝了,就进一步细分人群。这样一步步推进,最后用户会从数百万人一群的大群、细化为数万人的小群、最后甚至是数百人的小群。
这些人的经历、喜好、脾性其实是高度吻合的,也就容易捆绑成一个数据圈子,相互引用推送结果,进一步反馈推送效果——这样循序渐进,最终就可以勾勒出一个个独一无二的‘人’的需求。”
中国那么大,十亿网民里面,但凡细分到数百人一群的时候,对娱乐内容的喜好基本上可以做到完全相同了——毕竟,放到人群的总体样本来看,那都已经是百万分之一的小众需求了。
这么大一个国家,哪怕是再孤僻、特立独行的个体,好歹至少也有几百个人和他是兴趣爱好完全相同的,这种小概率事件并不奇怪。
初音系的人工智能要做的,就是在日渐分析中,把人群越分越细,或者兼顾几个判断维度交织一张数据评价之网,最终让“初秘”变得和主人内心的幽灵一样精准。
这样,任何人都离不开“初秘”了。
一旦离开,就会像顾莫杰怀念初音娘一样怀念。
陆文君反复咀嚼顾莫杰的话,最后终于豁然开朗。
“原来是这样……这都可以!”
“没什么不可以的,其实我们初音的这个想法,从理论上来说,曾经有很多空想家考虑过。只不过那时候没有深度学习型人工智能,这些空想家没法实现。而且这种设想实现之后,可以起到的社会效果和经济价值,也远远不是你现在可以想象的。”
顾莫杰顿了顿,开始说那个案例。
“18年前,凯文.阿什顿在给迪奥化妆品公司做市场调研工作的时候,就提出一个概念,叫做物联网——他幻想,有朝一日不仅人类要连接到互联网中,连产品也要链接进去。
届时一件产品是否被主人选中、买走;主人喜不喜欢这件产品,都应该有一个数据追踪的反馈,好让商家做出决策。而导致他提出这个概念和诉求的,正是他在迪奥观察唇彩销售数据时,发现的一个现象。”
女人一聊起化妆品,那都是两眼放光的。
陆文君一听卖口红都能卖出那么重大的改变世界的哲理来,顿时耳朵都竖起来了,浑似一只波斯猫:“快往下说!别墨迹。”
顾莫杰智珠在握地笑笑,继续说道:“凯文.阿什顿当年发现:迪奥公司的市场报表上,总是显示,某一种洋红色的口红,销量特别好。公司也经常增产这种颜色的口红,每每供不应求。在市场数据的良好反馈之下,这种颜色就继续增产,其他卖得不好的颜色则减产。
直到有一天,迪奥公司发现这种洋红色的口红终于出现滞销了、产量超过市场需求了。而且他们进一步赫然发现——在他们不断增产这种畅销洋红色口红的市场,他们的总口红销量出现了增长停滞、甚至是下滑。
然后,他们又横向对比了其他代工厂和市场大区的情况——因为每个市场大区搜集的用户偏好是不同的,所以因为洋红色特别畅销而立刻响应、相应最彻底的,只是迪奥公司的英国部分。
最后,他们得到的结论是:英国迪奥在对客户的口红颜色偏好方面,响应最积极,有数据反馈就立刻调整产量。但是他们的口红销售业绩增幅,是其他欧洲国家分区里最差的。”
陆文君听得很仔细,细细咀嚼了顾莫杰举的例子,好半晌都觉得不能理解。
“你是说,对市场销量反馈数据越迟钝的分公司,反而后来市场业绩越好?对市场反馈越积极、越增产畅销款、减少滞销款的分公司,反而努力了没好报?这不可能吧,完全和我们的认知常识相悖啊。”
“你也觉得不可能是吧?对,一开始我也觉得不可能。但是当我看完凯文阿什顿的物联网理论之后,我觉得这很正常。”
“快说快说,别卖关子。”
“因为,口红是一种差别很细腻、很难标准化的产品。
众所周知,护肤品、眼霜、面膜、粉底,这些别的化妆品,没多少规格,一个系列,就三五个款式,足够了。
口红完全不一样,一个口红系列出来之后,有一排的比色卡,从粉到红到紫,各个色度由浅到深能排列组合出至少三五十个颜色款式。所以生产口红的部门,往往是化妆品公司里最头疼的部门——规格太多,每样都大批量备货,很容易导致客户不太喜欢的颜色滞销,永远卖不出去——”
“诶呀这些我都知道,你直接说重点。”陆文君一阵焦躁。
姐堂堂一个妹子,还用自己老公科普口红产业的特点?这不开玩笑么。(未完待续。)