马岩 译
北京协和医学院卫生部老年医学研究所
英国食品标准局(FSA)资助的一个项目发现,根据那些生病的推特(Twitter)客在推特上的标签追踪到诺如病毒(noro virus)暴发。
该部门发现,通过用谷歌搜索来预测感冒流行进展,根据推特客网上抱怨自己生病,可在2周内预测病毒暴发的临床证据。FSA首席科学家Guy Poppy 2015年11月11日在英国媒体中心做了一个简要报告,该项目上周已获得英国政府数字奖(UK government's Digital Awards)一等奖。
目前,该技术仅可用于回顾性研究,并不能应用于前瞻预测暴发。然而,Poppy认为,当此项技术成熟时医务人员可以及时提供最初和紧急的院内干预,并在患者进入大门时便可预测出其感染。同时还有可能预测出疾病暴发的地理区域。负责运行英国民众浏览的英国国家健康体系(NHS)网站的NHS Choices机构已对此项目表现出浓厚兴趣。
Poppy说道,社交媒体作为一种新生及有力的方式,可浏览一系列事物,我们已经探讨其可应用于其他项目。
Poppy说道,当数据可以被很廉价及方便地获取时,大数据则可为FSA提供多种应用途径。物联网便是其中一个范例。所谓"物联网",是由数以10亿计电子元件和传感器相互关联而成,这些电子元件和传感器被植入各种电器产品中,如冰箱及烤箱。到2020年,超过250亿的这类电子元件每天将会产生500亿G的数据。但数据并非信息,我们须系统地在杂乱数据中筛选有价值的信息。
其中一个应用可能便是通过检测食品在贮存及转运过程中所产生的温度来制定其保质日期。如果食品从工厂到零售店的过程中冷藏转运系统足够有效,那么食品在货架上的存放日期则会延长,但不会有害人们健康,从而避免了潜在的食物浪费。
另一个应用可能便是监测食品加工过程中的温度。温度不够会有风险,因为它做不到食品完全无菌化。而过度加工食品同样有风险,因为高淀粉物质在高温烹饪过程中会产生丙烯酰胺及致癌物质。
Poppy说道,通过进一步在群体层面而非个体层面研究烹饪温度有助于相关部门更好地为公众提供建议。相关部门已通过参观消费者家庭,观察其烹饪过程,收集加工食物进行分析。但Poppy说道,在线监测可能得出不同见解。
然而,大数据并非绝对可靠。 2008年,谷歌流感趋势项目出现,但没能做到精确预测,导致人们对其远期测试结果失望,从而对其最初热情开始退却。此失败归咎于谷歌搜索引擎的改变,如2009年末提出的"自动建议",即用户在搜索打字的过程中推荐搜索主题。该功能可提高流感相关搜索量,从而破坏搜索量与实际流感病例之间的最原始关系。
英国政府投资4 200万英镑逾时5年建造阿兰图灵研究所(Alan Turing Institute),该研究所作为国家数据科学中心最初坐落于不列颠图书馆,但最后建址在图书馆与附近的弗朗西斯克里克研究所(Francis Crich Institute)之间。阿兰图灵研究所以英国计算机科学先锋鼻祖的名字命名,旨在成为Poppy描述的发展有效利用大数据的算法中心。
BMJ 2015;351:h6105 doi: 10.1136/bmj.h6105