不搜索,你能想起万维网(World Wide Web)的发明人是谁吗?
你可能脱口而出谁是微软的创始人,谁是苹果的灵魂人物,而对于和他们同岁的(1955 年生)万维网发明人,对现代人类社会生活同样影响深远的人物,可能没有那么多人能够叫得上名字。我们今天通用的浏览器,网址,网页的标记语言,超链接等概念,都来自这个人的构想。
万维网的诞生
1989 年正是微软蒸蒸日上的时候,比尔盖茨已身价上十亿,乔布斯已经在 NeXT 和 Pixar 开始了人生的第二次创业。而万维网的主要发明人,蒂姆·伯纳斯-李(Tim Berners-Lee)还是 CERN(欧洲核子研究中心,Center of European Organization for Nuclear Research) 的一名研究员。那时候的因特网还只是大公司,学校,研究员和极客才会关心的试验品。那时候的伯纳斯-李已经在开始构想一个互联的网络,互联的数据,知识的链接与知识关系的整理,机器自动对人类知识自动的理解,等等。这些话题中的任何一个实现了,都会成为人类文明里程碑式的事件。
而 1989 年的伯纳斯-李就提交了这样一份项目计划书,旨在构建一个统一标准互相连接的网络,并开始基础模块的设计与建设:通用资源标识标准(URI,我们今天熟悉的通用资源资源定位符,URL,或网站链接,就是标准的一部分),超文本传输协议(HTTP),和超文本标记语言(HTML)等。他还编写了第一个网页浏览器,网站服务器和服务器软件。我们还能从最早的网页存档中看到当年互联网的雏形:
https://www.w3.org/History/19921103-hypertext/hypertext/WWW/TheProject.html
万维网标准并不是当时唯一的因特网应用,也不是唯一的超文本协议标准。但它大大提升了网络的互联和可用性,并传播开来击败其他的协议(如 Gopher 等),成为网络上最通用的标准。我们今天每次刷新网页点击链接都离不开他当年的畅想。
后来的伯纳斯-李在 MIT 创建了万维网联盟(World Wide Web Consortium,W3C),主持万维网标准的制定,保证万维网的开放与自由。伯纳斯-李没有为万维网申请任何专利或是使用授权费,所有的标准和协议都是自由且开放的。因为只有这样,才能保证人人都能采用并实现这样的标准,才能保证网络能够得到真正的“互联”,而不是以私有协议构建的一座座信息的孤岛。
2017 年伯纳斯-李爵士因对万维网的贡献荣获图灵奖,也称“计算机界的诺贝尔奖”,可谓实至名归。
而他对互联网的畅想的实现才刚刚起步,已经荣誉满身的他仍然在为一个数据互联,去中心化,开放自由的互联网工作,呼吁互联网中立,呼吁政府开放共享数据。
更多对互联网诞生的介绍:
- 维基百科,Tim Berners-Lee:Tim Berners-Lee
- 维基百科,W3C: World Wide Web Consortium
- 维基百科,万维网的诞生:History of the World Wide Web
- 西瓜大丸子汤对伯纳斯-李的介绍: WEB的50年——从TIM BERNERS-LEE的图灵奖说起
- 西瓜大丸子汤对互联网诞生的介绍:WEB的诞生与TIM BERNERS-LEE
语义网络与数据互联
在伯纳斯-李的构想中,万维网只是第一步。它以超链接的形式实现了“文档(documents)”的互联,使得人们可以畅游互联网;但他的构想的第二步是实现所有“数据(Data)”的互联,使得人类知识能够以统一的协议(如 RDF 标准)更容易地被机器读懂,并进行自动的数据联系和逻辑推理。
比如,在一张网页中,你可以读到介绍伯纳斯-李曾经就读牛津大学,但需要机器理解伯纳斯-李和牛津大学的联系却很难。互联数据,就是以统一的标准,表达伯纳斯-李和牛津大学这两个词之间的关系。通过联系所有数据之间的关系,机器在搜索”伯纳斯-李就读的学院“时,就能准确地判断并返回牛津大学。而一个以标准协议互联的数据网络,就是伯纳斯-李所构想的“语义网络”。
在 TED 的演讲(Tim Berners-Lee On The Next Web)中,伯纳斯-李提到了一个例子:比如对阿茲海默症的研究,关于患者基因的数据,和他们蛋白质的数据在不同的机构的数据库中。如果能够将这些数据相互联系,你能够提出各种相关并且具有相当价值的问题,比如:“什么样的蛋白质既和信号传导有关,有和锥体神经元有关?”你问谷歌类似的问题,你很难找到满意的回答;而如果你在两个相联的数据库中搜索,你能够得到更有意义的答案。这对科研人员意义重大,尤其对于跨学科和领域的研究。而如今很多数据都没有得到开放,或是没有相关的联系。
所以伯纳斯-李在致力推动数据的公开与互联,第一步是政府数据公开:呼吁政府将各个机关部门采集的数据以原始数据的形式公开给公众和科研人员,使得科研人员能够从中挖掘出有效的信息。他在上述的 TED 演讲中不仅解释了互联数据的重要性,还带领大家大喊“现在就要原始数据!(Raw Data Now!)”。他许多年的努力和呼吁得到了回应:2009 年奥巴马宣布了开放政府计划,旨在建造一个“前所未有开放的政府”,致力于开放政府机构中医疗,能源,气候,教育,金融,公共安全和全球发展等各部门的数据。
每一次人类能够促进信息表达、传递和交流的发明都是在人类文明历程中浓墨重彩的一笔,如造纸,印刷,电话,电视,因特网以及后来的万维网。伯纳斯-李在很早以前对语义网络的构想,就很可能会成为下一个这样的重要发明。
更多介绍:
- 伯纳斯-李在 TED 讲述下一个互联网(视频):Tim Berners-Lee On The Next Web
- 伯纳斯-李在 TED 讲述下一个互联网(演讲稿):Tim Berners-Lee On The Next Web
- W3C 语义网络标准介绍 W3C Semantic Web
- W3C 互联数据的设计问题 W3C Design Issues: Linked Data
- 维基百科,互联数据 Linked Data
- 维基百科,开放政府计划 Open Government Initiative
互联网迎受的挑战
然而,在万维网之父眼里,互联网的发展并不是一帆风顺的。在最近接受媒体(如卫报和 Axel Springer)的采访中,互联网伯纳斯-李称对他认为如今互联网发展遇到的问题与挑战表达了忧虑,总结起来有如下几点:
个人信息,隐私和自由被侵犯
如今大部分网站的业务都是以提供免费服务,并根据个人的浏览信息提供广告。这意味着我们的隐私也将被大公司掌握,而我们本身没有对数据有太多控制,比如决定什么应该被分享给第三方。政府对个人信息的监控,也意味着政府权利将会得到前所未有的扩张。大规模的政府监听可以使得政府针对异见者进行监控和抓捕,这对一个社会的言论自由有着毁灭性的打击。政府对网络的封锁也导致个人的自由与权利遭到破坏。一个被设计为“自由,互联”的万维网却在实际上无法得到真正的互联。
互联网中立性被破坏
互联网中立性简单概括起来是,互联网服务提供商和政府机构应该对互联网上的所有数据“一视同仁”,即不会因为数据的来源、去向,或是内容对其进行屏蔽或是降速。
伯纳斯-李称,互联网的美妙之处便在于它是开放,自由和中立的。所有的企业都能在一个公平、中立的平台上进行竞争。但如果互联网中立性遭到破坏,互联网提供商能够针对网络上的数据内容进行降速甚至是屏蔽,将会很容易使小新型企业被压制,大企业遭到垄断。而如今,互联网中立性正在遭到破坏。
更多介绍:
- 互联网中立 Net Neutrality
虚假新闻太过于容易传播
如今的新闻,社交媒体和搜索引擎网站大多数都根据用户点击数量获取利润,这导致“标题党”和随之而来的虚假新闻在网络上迅猛传播。这可能是一个希望网络能够促进真相的传播的万维网早期创造者始料未及的事情。
政治的宣传
一个更加中央化的互联网意味着许多人有了更少,更集中的消息来源,也意味着政治宣传能够更加针对个人进行宣传。比如大选期间的政治宣传,将会针对不同用户进行并不相同,有时甚至是相互矛盾的宣传。这会导致一个追求民主社会的退步。
小结
万维网的诞生对人类社会带来了不可估量的影响。如今的万维网之父还仍在为一个自由、互联、开放的互联网络忧虑和奔走。
他说:“我创造了万维网,但是是世界上所有的人的合作让它成为了今天的样子:博客,推文,照片,视频,应用,网页和各种来自所有人的贡献,从内容创造者,到为网络开放自由斗争的政治人物,到 W3C 这样的标准制定机构。”
“互联网的今天离不开我们所有人,”,他说,"而我们今天仍需合作,去建造一个我们心目中互联网的明天——为了我们所有人。”