阿根廷华人在线_她为何能预测古巴霍乱和埃博拉病毒爆发? - -阿根廷华人门户网站

阿根廷华人在线

  • whatsapp 1122582205
  • 邮箱:horizontechino@gmail.com
搜索
阿根廷华人在线 首页 查看内容

她为何能预测古巴霍乱和埃博拉病毒爆发?

2020-1-22 15:31| 发布者: | 查看: 40| 评论: 0

摘要: 武汉新型冠状病毒肺炎疫情最早发现应该是2019年12月8日,现于报端是12月30日,再到全国范围内引起警觉和高度重视,已经经过了三周时间。笔者进行了自我反思,作为每天都关注新闻和舆论,曾经有多年的公共事务研究经 ...


武汉新型冠状病毒肺炎疫情最早发现应该是2019年12月8日,现于报端是12月30日,再到全国范围内引起警觉和高度重视,已经经过了三周时间。

笔者进行了自我反思,作为每天都关注新闻和舆论,曾经有多年的公共事务研究经历的读书人,居然对事态的演进没有预测和判断。突然心生不安和焦虑,为什么我那么不敏感,为什么此前年轻一代学者、研究者、媒体人都不敏感,最后扛大旗的人还是抗击SARS那帮以钟南山院士为首的老英雄。且充满感慨,中国互联网界和科技界这么强调大数据,最后无一应用于社会科学研究和相关事件预测和预警。

于是想起一个科技界的奇女子。一个叫吉拉·拉丁斯基的数据科学家,以色列犹太人,85后。她曾利用大数据预测古巴霍乱和非洲埃博拉病毒。人们给她冠以“先知”之名。这个“科技女巫”,真的很传奇。

笔者听过她演讲,跟她有一两句的交流。她说话声音很平静,看上去很清瘦,网上的照片应是不上相,穿着打扮就是一个科学家和研究者的模样。


她原出生于乌克兰,1990年,苏联解体前夕,她4岁时,母亲为了让她在稳定的环境中获得良好的教育,带她到以色列定居。而他父亲选择留在乌克兰,做正统的犹太人,后来就不与她们相往来了。

8岁,她开始学习编程,15岁以史上最年轻的年纪进入以色列理工学院进修,与已经服完兵役的同学们一起读本科。在本科期间,她还服了兵役,成为某绝密组织的一员。退伍之后,本科也顺利毕业了,于是接着完成硕士学业。

为什么她那么小就学编程,因为她母亲和姑母都有数学和计算机的高等教育背景,有一个说法是,她就出身于数学世家。妥妥的天才基因和完美的教育环境。

2007年,21岁的她被美国麻省理工学院录取,攻读博士,主修数据挖掘技术,26岁毕业。读博期间,在微软当过研究员,开发应用大数据预测重大事件的算法,包括政局变动和重大流行病。她用来预测古巴霍乱疫情的算法也在这期间初具雏形的。此外,读博期间,她还在以色列创立自己的公司Salespredict。

至于,她为什么会创业,主要是受她丈夫的影响。她的丈夫是她的高中同学,两人都是学霸。以色利科技初创企业的氛围很浓厚,她丈夫比她先创业,受他影响,她才从学术研究转到创业中去,并且方向是真正的学以致用,用数据挖掘技术和大数据分析来预测研究重大事件的发生概率和发展趋势。两人现在都是以色列的科技新贵。

Salespredict一炮而红,是因为2013年,她提前几个月成功预测了古巴百年难遇的霍乱疫情。主要的研究方法是,她带领团队挖掘了150年的文献资料,并发现了诸多历史事件之间的联系,最终准确预测了。历史规律总是需要不断复盘,思考,最终用很多事件去印证,但发现一个关键信息,并且加深研究,也很重要。比如,有一条信息是这样的,在孟加拉,1982年发生干旱之后又有洪水暴雨,随后发生了霍乱。水多的国家容易发生霍乱。


这种数据挖掘结合文献研究的做法,真的挺神奇的,为学术研究提供了创新性、普适性的框架。任何一个信息,可能都不是孤立存在的,一定有某种关联,而要真正找到紧密的因果关系,需要灵感直觉、逻辑推理、及算法算力的支持。

在人工智能时代,人们总是担心它比人厉害多了,还能深度学习,将来要替代掉人,很多人都要失业。其实,这种担心是多余的,人工智能远不能脱离人去研究人类社会,因为它不能像人一样具有复杂背景的思考能力,因而可以做出更贴合人类社会的因果推理。人工智能更没有直觉、灵感等玄妙的力量。

机器只知道简单的关联关系和因果关系,而人不仅可以关注复杂的因果关系,还能加入动力学等观点,进行复合理论研究和推理。

又比如,2011年,她发现在阿肯色斯州,在google上有很多人搜索鸟类死亡,但没有发现有传染病传播的痕迹,后来很多死鱼也被冲上了岸。人们纷纷怀疑,是不是动物集体自杀了?或是末日要来了?抑或是要发生地震等自然灾害了。

但后来研究发现,都不是,是原油外泄了。这个事故发生在六个月前。这么久之前的事件,机器是想不出来的、更关联不上的。只有人具有推理能力,因为氧气在水中被油完全隔绝,需要3-6个月的时间。也就是说,水中彻底缺氧了,大批鱼类才会死亡,鸟没有鱼吃,也会死亡。

还是2011年,日本海啸,ipad在美国西岸价格升高。什么原因呢?机器肯定也找不出来。只有人类知道,因为其中一个芯片提供的厂商是位于日本海边的工厂,造成ipad短缺。要买,就要付高价。

而对于埃博拉病毒,她的团队曾经开发过一种专门追踪和分析埃博拉病毒的软件。通过数据挖掘,他们发现,在非洲的一些地区,人们为了寻找黄金或钻石,会大面积毁坏森林,使得动物被迫迁徙,流离失所,其中就包括一些携带了埃博拉病毒的蝙蝠,而后来据传有人吃了蝙蝠,这显著地加大了埃博拉病毒爆发蔓延的概率。


现在人们发现,大部分的病毒都是蝙蝠携带的,甚至它们都是SARS的原宿主,本来动物和病毒之间可以相对和平地相处,但自然界里的平衡随着人类吃野生动物而打破。人深度参与了还未被完全认知的生态循环之中,是多么可怕的一件事啊。

吉拉现在在以色列,还在进行各地区犯罪概率高低的预测,比如预测下一个犯罪点是哪里,用算法,可以影响警察巡逻,从而降低犯罪率(据称,目前已经降低了12%)。具体的素材(或指标方面)包括:每个地区的收入、废弃的建筑物和车辆的情况,twitter上是否经常讨论,还有警方给的犯罪记录等等,根据这些情况推测下个月可能发生高犯罪率的地方。

关于预测流感,谷歌曾经非常想预测,比如一段时间内搜索的多了,是不是代表流感可能要就爆发了,最好能够提前两三周能预测到。但其实光是搜索引擎这个工具,是达不到效果的。这背后还是一个复杂的社会系统和生态系统的研究。

中国的人工智能和大数据已经很发达了,真希望有一天,也能够应用到社会研究上,特别是对于疾病疫情等突发事件的预测。中国现在对于大数据、物联网、5G、生物医疗产业越来越重视,但其实还应该搭配发达的社会研究。


笔者现在非常担忧自己直觉和研究能力的退化。半年前的一条看似孤立的信息,都可能是某个事件发生的导火索,但我们竟然对一条几周前的武汉新型冠状病毒肺炎的信息,那么不警觉。特别是一想到,身边认识的孩子们,呼吸道弱的人越来越多。到处都是支气管炎、哮喘和过敏性鼻炎患者,本来肺部系统就弱,空气及飞沫里传染的东西,真的不能再轻视半分了。

1月17日,世卫组织通过疾病模型推算出了感染的数字,当时看上去比报告的多不少。这几天一个SIR模型在流传,用SARS参数模拟武汉新型肺炎传播途径。主要结论是50天左右集中爆发(12月8日至1月20日);从病毒爆发后的大概90天达到高峰(3月上旬),4个月左右接近尾声,5月上旬结束。这个研究也是很实际的。

也感慨,中国什么时候才能出现吉拉这样,文理科全通,社会科学和计算机科学全通的人才啊。

最后祝大家都健健康康、平平安安的。


「 本文仅代表作者个人观点 」

「 图片 | 视觉中国 」



秦朔朋友圈id:qspyq2015 开白名单:duanyu_H



鸡蛋

鲜花

雷人

酷毙

漂亮

客服电话

whatsapp 1122582205

报社工作时间 周一至周六 10:00-18:00

客服QQ点击咨询

微信公众号

APP客户端

Copyright © 2011-2017 https://www.51argentina.com All Rights Reserved. Discuz!X3.2 蜀ICP备16028384号-2

返回顶部