AI和大数据让挑战巨头的路更加困难

原文地址:https://www.wired.com/story/ai-and-enormous-data-could-make-tech-giants-harder-to-topple/

新的一周,Google公开了一项在AI领域的破纪录研究成果。该项研究成果揭示了一个重要的信息。传统上我们认为,日益依赖消费者和社会经济的科技公司特征是创新和反垄断的——这也是小企业可以颠覆大公司的机会所在。然而当科技公司之间的竞争依赖于通过大数据进行的机器学习之时,小公司颠覆巨头的道路将会变得更加艰难。

Google周一发布了他们与Carnegie Mellon大学一项不菲的合作。双方的图像识别实验室在两个月里整合了50个强大的图形处理器,并使用了一个前所未有的3亿张标记图像(其他实验室大部分都只使用百万量级的图片标准集合)。这个实验的目的在于测试是否可以通过给计算机更大量的数据,而不是通过调整算法来提高机器对图片的识别率。

答案是可以。Google和CMU的研究人员使用规模庞大的新数据集对一套标准的图像处理系统进行训练之后,发现系统在数项标准测试中得到了新的高分——这些测试目的在于在评估软件解读图片的能力,比如识别照片中的物体。在他们输入的数据量和图像识别算法的准确性之间有着清晰的关系。这些发现在某种程度上解答了一个在人工智能学界流传的问题,即即是否可以从现有的算法中获得大量的数据,从而进一步获得更多的数据。

数据越多能产生更多的性能,这表明,像谷歌、Facebook或微软这样的数据丰富的科技巨头,可能会有更大的好处。图像处理系统基于谷歌包含3亿张图片的巨大数据集进行学习,这并未产生巨大的好处——从100万张图片到3亿张图片,系统识别对象能力的得分仅仅提升了3个百分点——但论文作者表示,他们认为可以通过调整软件更好地适应超大型数据集来扩大这种优势。即便事实证明情况并非如此,但在科技行业当中,很小的优势也可能造成重要影响。比如,就自动驾驶汽车视觉技术的准确性来说,每一点增益都是至关重要的;而对一款能够创收数十亿美元的产品而言,小小的效率提升将能产生滚雪球效应。

在科技公司眼中,囤积数据已经成为一种防御性策略。谷歌、微软和其他公司都开放了大量的软件,甚至是硬件设计,但是对于这些工具的使用却没有那么大的自由。科技公司确实发布了数据:去年,谷歌发布了一个庞大的数据集,从超过700万的YouTube视频中提取出来,而Salesforce则开放了一个从维基百科中提取的数据,以帮助算法处理语言。但是,人工智能发展实验室的合作伙伴、劳伦斯伯克利国家实验室的访问研究员卢克德Oliveira说,(正如你所预料的那样)这样的发布通常不会给潜在的竞争对手提供太多的价值。他说:“这些数据从来都不是真正对产品市场地位至关重要的数据集。”

谷歌和CMU的研究人员表示,他们想要他们的最新研究成果,即他们所说的“海量数据”的价值,以促进更大的、谷歌规模的、开放的图像数据集的创建。他们写道:“我们真诚的希望是,这能激励愿景社区不要低估数据,并在构建更大数据集的过程中共同努力。”CMU的Abhinav Gupta说,一个选择是与普通的视觉数据基金会合作,这是一个由Facebook和微软赞助的非营利组织,它已经发布了开放的图像数据集。

与此同时,数据量小的公司想要在数据竞争中生存下来,他们需要自己的算法变得更聪明和更有创意。Jeremy Achin是初创公司DataRobot的首席执行官,他猜测,随着机器学习变得对越来越多的公司和行业举足轻重,一种见于保险行业的模式可能在更大范围内流行起来,即众多小保险公司(认真地)把各自数据“拼”到一起,以使其风险预测能够匹敌那些规模更大的竞争对手。

让机器学习不再那么渴求数据,这方面的进步有可能颠覆人工智能的数据经济学;优步去年就收购了一家从事相关研究的公司。但现在,后者仍然有可能试着避开人工智能巨头公司已有的数据优势。Fast.ai是一家致力于让机器学习变得更容易的公司,其联合创始人蕾切尔·托马斯(RachelThomas)表示,初创公司可以在由互联网巨头把持的领域之外找到应用机器学习技术的地方,就比如说农业。“我不确信这些巨头公司一定在所有领域占据着优势,在很多特定领域中,根本没有人在收集数据,”她如是说。即便是人工智能领域的巨头也有盲点。

最后编辑于
©著作权归作者所有,转载或内容合作请联系作者
  • 序言:七十年代末,一起剥皮案震惊了整个滨河市,随后出现的几起案子,更是在滨河造成了极大的恐慌,老刑警刘岩,带你破解...
    沈念sama阅读 202,905评论 5 476
  • 序言:滨河连续发生了三起死亡事件,死亡现场离奇诡异,居然都是意外死亡,警方通过查阅死者的电脑和手机,发现死者居然都...
    沈念sama阅读 85,140评论 2 379
  • 文/潘晓璐 我一进店门,熙熙楼的掌柜王于贵愁眉苦脸地迎上来,“玉大人,你说我怎么就摊上这事。” “怎么了?”我有些...
    开封第一讲书人阅读 149,791评论 0 335
  • 文/不坏的土叔 我叫张陵,是天一观的道长。 经常有香客问我,道长,这世上最难降的妖魔是什么? 我笑而不...
    开封第一讲书人阅读 54,483评论 1 273
  • 正文 为了忘掉前任,我火速办了婚礼,结果婚礼上,老公的妹妹穿的比我还像新娘。我一直安慰自己,他们只是感情好,可当我...
    茶点故事阅读 63,476评论 5 364
  • 文/花漫 我一把揭开白布。 她就那样静静地躺着,像睡着了一般。 火红的嫁衣衬着肌肤如雪。 梳的纹丝不乱的头发上,一...
    开封第一讲书人阅读 48,516评论 1 281
  • 那天,我揣着相机与录音,去河边找鬼。 笑死,一个胖子当着我的面吹牛,可吹牛的内容都是我干的。 我是一名探鬼主播,决...
    沈念sama阅读 37,905评论 3 395
  • 文/苍兰香墨 我猛地睁开眼,长吁一口气:“原来是场噩梦啊……” “哼!你这毒妇竟也来了?” 一声冷哼从身侧响起,我...
    开封第一讲书人阅读 36,560评论 0 256
  • 序言:老挝万荣一对情侣失踪,失踪者是张志新(化名)和其女友刘颖,没想到半个月后,有当地人在树林里发现了一具尸体,经...
    沈念sama阅读 40,778评论 1 296
  • 正文 独居荒郊野岭守林人离奇死亡,尸身上长有42处带血的脓包…… 初始之章·张勋 以下内容为张勋视角 年9月15日...
    茶点故事阅读 35,557评论 2 319
  • 正文 我和宋清朗相恋三年,在试婚纱的时候发现自己被绿了。 大学时的朋友给我发了我未婚夫和他白月光在一起吃饭的照片。...
    茶点故事阅读 37,635评论 1 329
  • 序言:一个原本活蹦乱跳的男人离奇死亡,死状恐怖,灵堂内的尸体忽然破棺而出,到底是诈尸还是另有隐情,我是刑警宁泽,带...
    沈念sama阅读 33,338评论 4 318
  • 正文 年R本政府宣布,位于F岛的核电站,受9级特大地震影响,放射性物质发生泄漏。R本人自食恶果不足惜,却给世界环境...
    茶点故事阅读 38,925评论 3 307
  • 文/蒙蒙 一、第九天 我趴在偏房一处隐蔽的房顶上张望。 院中可真热闹,春花似锦、人声如沸。这庄子的主人今日做“春日...
    开封第一讲书人阅读 29,898评论 0 19
  • 文/苍兰香墨 我抬头看了看天上的太阳。三九已至,却和暖如春,着一层夹袄步出监牢的瞬间,已是汗流浃背。 一阵脚步声响...
    开封第一讲书人阅读 31,142评论 1 259
  • 我被黑心中介骗来泰国打工, 没想到刚下飞机就差点儿被人妖公主榨干…… 1. 我叫王不留,地道东北人。 一个月前我还...
    沈念sama阅读 42,818评论 2 349
  • 正文 我出身青楼,却偏偏与公主长得像,于是被迫代替她去往敌国和亲。 传闻我的和亲对象是个残疾皇子,可洞房花烛夜当晚...
    茶点故事阅读 42,347评论 2 342

推荐阅读更多精彩内容