大家好。今天就媒体智能化技术方面,有哪些挑战跟大家分享一下。这是马云在互联网大会上的发言,核心四个字“降维、跨界、颠覆、转型”。新媒体新在哪里?我们用三个“动”来概念,第一个是互动,不是一方面去说,另一方面去说,不是被动的接受,而是大家都在说、都在听。另外一个是联动,你在动的时候,实际上还是有一些涟漪效应,一件事情的发生会波及很远的地方,借助今天的网络有这样的情况。第三个是自动。大家分享的都是跟自动相关的问题,很多人必须借助接入的环节,现在可以从这个环节省略出去了,核心就是“动”。
新媒体表现,数据同时是程序。一个很有意思的例子,上市公司的年报,从2004年、2005年开始一开始是试点,最后是全面推广,采用机器可读的语言。一开始上市公司必须做两份,一份是机器人可读的,一份是人可读的。我们在2013年就实现了合一。在WORD敲这些数字的时候,背后有一些东西可以把信息提出来,机器可以自动进行分析、对比、环比、同比和各种数据的比较,包括行业的比较。它是一种能够引发互动的数据,不是简单的静态的数据。
内容同时是手段,消费同时在生产。在社交媒体上比较突出的,阅读的同时在编辑。读的行为本身在影响版面的位置和排序,甚至会影响标题。员工同时是老板,员工可以分咐写作机器人干活。
这里面核心就是“动”,冯诺依曼体系的核心就是“动”。
我们认为未来是属于智能媒体的。在两千年左右的时候,人类的眼球是有限的,大家都在争抢有限的眼球,眼球的体现在那个时代就是域名。我们记得很清楚,当时新浪刚刚开张,是说一不二的,在中国的门户网站是最大的,想要跟它谈搜索引擎,他们是很瞧不起的。我们可以做搜索引擎,它不会出现在前台的。所以它对搜索引擎的价值是严重低估。当关键词作为商品的时候,搜索引擎作为入口,配套有一些商业模式。我们很想问一句,什么会作为商品?什么作为入口?什么是商品,如果强调互动,就是新闻的呈现方式是你问我答,处在前台答问的机器人就是商品。如果像“今日头条”把一个排序作为一个载体,无论怎么样一个情况,我们要提升到入口,提升到门户网站、搜索引擎的下一代。
白硕在“智能+”传媒超脑论坛上发表演讲
大家都在谈论人工智能,我们简单回顾一下人工智能的冷热史。三波高潮,实际上也有两波低潮。感知机,专家系统,导致低潮的有两个,一个是逻辑的局限,XOR,一个是非良定义问题。文字的识别,语言的理解都跟这个有关系。
在大数据的背景下,又赋予了一些新的生命。这波人工智能热都有哪些表现,产业热:“大脑”,机器人;投资热:人工智能概念股;学术热:真脑、仿脑、电脑;八卦热:奇点恐慌。
为什么会这样?快、准、大、神。什么是快,硬件的进步,准,就是算法的进步,大,大数据的积累,神,就是好奇心、阴谋论。这是热点分布图,三波主要的成就按照两个纬度,把主要成就投到平面上。人工智能的三波高潮在什么地方?很有一个意思的现象,第一波是玩具系统,表述相对清晰,解决相对稳定。到了第二波是表述仍然比较清晰,解决有困难,这个在第二波里面基本上攻克了,再往前走遇到常识获取,非常困难。第三波斜着走,表述比较模糊,解决起来越来越难,包括图象识别和自然语言的理解。第四波,就是最右边的,包括推理、规划、常识获取、情感与自我意识。自然源理解在第三波里面还是相对浅层的,到第四波就是深层的。涉及到写作,还会涉及到情感等等。
非良定义问题解决思路,表述模糊,人自己的标准是可以解决的,机器要向人学。横着分三个空间,有的是问题空间,中间是特征空间,右边是解空间。竖着三个阶段,上面是知道问题怎么样,表示什么样,就是建模。第二个是根据数据来对应,调参。第三个是运行。
非良定义问题的可能风险:建模可能有失真,采样可能造成分布偏差,标准可能有错误,学习可能过拟合。
未来的发展方向,就是从调参到建模。这是知识表示的层次,我们不能神话深度学习,我们看到深度学习所有都在中间的位置。实际上框架空间、元组空间,还有很多事情可以做。
写作机器人,我觉得比较难的问题,一是归因,二是举证,三是应景,最后是个性风格。归因就是描述了这些现象,这些现象也有一些脉络,究竟是哪些东西导致了这个现象,这个是归因,在一天的航行结束之后描述走势,什么东西导致了这个走势就要去归因。第二个是举证,提出一个观点要找几个例子。还有应景,一个过程描述完之后,画龙点睛的是什么,用成语、古诗很贴切的描述。这是写作里面比较难的地方。最后就是个性风格。
机器可读新闻,在对接程序化交易,形成一个结构化标签体系。
知识图谱,这个对于我们描述,尤其给一个客户画像,通过他看的东西,通过他接触什么样的内容,来给他画像。过去可能是一个点评的,现在借助知识图谱,用这个给他画像,会更精确。