医学上还存在着一种还原论的观点,这在“人类基因组计划”中得到了充分的体现。它的前提假设是:理解基因组的变异能够告知每个人患病和治疗的风险。这种线性思维并没有意识到健康和疾病的复杂性,以及与微生物群、免疫系统、表观基因组、社交网络、环境乃至更多方面的多维相互作用。
整合一个人的所有数据是关键的第一步。我们必须将数据视为一种活的流动性资源,需要提供所有新的相关数据来进行“培育”和“喂养”,而这些数据可能来自各种传感器、生活中的应激事件、职业变化、肠道微生物检测结果、孩子的出生等。所有这些数据必须进行不断的整合和分析,只有无缝对接才不会对个人带来任何干扰。这意味着我们不应该进行任何手动的登录和注销操作,也不需要进行额外的工作。但实现这一目标并不容易。比如,如果不通过应用程序或网站进行手动输入,我们就无法捕获所摄取食物的相关信息。我曾经在两个星期内对自己的锻炼、睡眠以及摄取食物数据进行了手动记录。好在我只需要坚持两个星期。学习时间超过几天的任何人工智能顾问,都不应该让用户主动输入数据。
对此,人们已经提出许多创造性的被动解决方案,有的则在积极探索之中。我担任谷歌的顾问时,谷歌与罗切斯特大学的生物医学工程师合作,设计了一款马桶座圈,人坐在上面时就可以测量血压。此外,他们还想出了其他方法,如让人在站在体重计上或照镜子时获取生命体征,不经意间获取有效的数据。许多公司还在开发特殊的智能手机应用程序,通过光谱或比色来扫描食物,如Onduo的智能手机人工智能图像检测。如果这些结果准确的话,确实会有所帮助,但仍然需要个人花精力,而且需要提前想到这个环节,因此并不太吸引人。
在美国,新型智能手表也正在收集比以往更多的数据,如Fitbit的Ionic或Versa,它们可以获得连续的心率、睡眠和体育锻炼等数据。理论上这些数据对人工智能助手来说是有价值的输入数据,但存在一个问题:数据质量。众所周知,睡眠过程中的移动只是大脑活动的一种替代,并不如通过脑电图监测大脑的电波活动来得精确;而且虽然数字跟踪器可以计算步数,但它们仅适用于某些活动,如散步,而不适用于骑自行车或游泳等。所以,如果数据质量得不到保证,那么要想从人工智能助手中得到有意义的输出,就有些难度了。
在图12-3中,我描述了指导个人健康的深度学习模型的复杂性。该图描述的是一个人真正的“大数据”,这项挑战纵然艰巨,但非常适合人工智能。想要获得所需的实时、准确、可预测、有价值的输出,以促进健康的指导建议,可能需要数百个神经网络的隐藏层。一些人工智能专家发现,这种单一的模型过于简单且并不现实。但我们正需要这种端对端的深度网络,复杂的网络架构很可能需要结合其他学习型人工智能工具,有些甚至尚未开发(可参考前文提到的AlphaGo)。
[插图]
图12-3 深度神经网络原理示意图
在许多方面,我们的确不知道每个人的“整体”到底是由什么构成的,信息丰富的全景图在人与人之间可能存在很大的差异。比如,需要哪些特定的传感器来预防或管理疾病?再比如,转录组或表观基因组虽然在整个身体中是不同的,但它们对于特定的细胞类型则是唯一的,而且获取的十分有限。
事实上,目前的电子健康档案对个人健康状况的记录非常狭义、不完整,且漏洞百出,在未来,这将成为虚拟医疗助手的最大阻碍。对个体进行深度学习的输入数据依赖个人数据的完整性和准确性,而对美国电子健康档案的价值的误解,促使我写了一篇题为《你的医疗数据》(Your. Medical. Data.)的推文(见表12-1)。