手机版
扫描查看手机站

数据科学,如何帮我们应对新冠疫情?

来源:互联网/编辑:IT世界网/时间:2021-12-09

在手机上看

扫一扫进入手机端

在新冠肺炎疫情期间,许多数据科学家和商业分析从业者被吸引到流行病学领域。当然,他们大多数人都很乐意这样做。拥有数据科学团队的大型企业希望尽可能多地了解这种流行病在他们开展业务的地区可能感染的情况。一些组织已经有了一些流行病学家或医务人员,但他们不一定有足够的分析师来定量分析病毒流行和病例增长的数据。

这些数据科学家努力的主要方向是报告或预测由新冠肺炎引起的病例和/或死亡。虽然很多网站都提供了关于这种疾病疫情的基本描述性分析,但大多数网站都没有提供未来感染病例和死亡的预测,这些网站提供的数据不够准确,企业无法使用。很多公司因为自身的行业特点和商业模式,有很好的理由去做这项工作,找出这次疫情对他们的业务、客户和员工的影响。

因为数据科学的每个具体用例都取决于环境,所以我也会在介绍每个用例时介绍应用这个用例的公司。一些公司及其代表希望保持匿名,但他们证实了项目的细节。

数据科学,如何帮我们应对新冠疫情?

一家人寿保险公司预测死亡人数

某大型寿险公司的分析与数据科学团队于2020年3月启动了一个项目。该项目的目标是预测新冠肺炎疫情造成的死亡。人寿保险公司需要了解任何导致意外死亡人数大幅增加的疫情,并预测其可能的发展。当然,公司对其机构和办事处的员工何时可以安全返回办公室工作以及有多少人可以返回岗位的问题也非常感兴趣。

他们的模型显示,新冠肺炎疫情造成的死亡人数将高于大多数人的估计,这在一定程度上取决于控制病毒传播的措施。这些模型不仅依靠报告的死亡人数进行推断,而且还分析了“超额死亡人数”,超额死亡人数指的是那些由新冠肺炎造成但未纳入官方统计的死亡人数。这些数据科学家多次调整他们的模型,以覆盖美国各地的新数据和新防疫政策。该模型总结了各州层面的预测数据,考虑了各州计票遗漏和政策收紧开放水平的影响。然后,公司将所有州划分为四个标准化的开放阶段。标准化阶段的分类包括学校是否开课/停课、非必要业务和其他设施和机构是否开放等标准。

为了评估疫情对分支机构及其办公室的影响,数据科学家还根据县级数据进行了更详细的预测。分析小组没有预测新冠肺炎的感染病例数,为——例,部分原因是感染病例数对公司业务影响不大,主要原因是关于美国病例数的现有数据不可靠。公司所有的高管和部门都对团队的分析结果非常感兴趣。

一家物流公司预测疫情对人员配备的影响

某物流公司卫生安全负责人正在思考如何利用数据帮助公司更好地适应疫情。由于他的工作职责包括病假计划,他非常有兴趣预测员工因新冠肺炎感染而请病假的情况,以及这些情况将如何影响公司的运营。他要求他的分析团队成立一个小组,研究新冠肺炎对公司的影响。其中一个关键项目是预测新冠肺炎感染导致的病假。

健康安全负责人说,这个小组很受欢迎,公司各部门的要求纷至沓来。但总的来说,他指出,管理者更感兴趣的是已经发生的事情的描述性数据,而不是预测未来可能发生的事情。

一家动物保健公司预测对肉类加工厂的影响

First Analytics是一家分析和数据科学服务公司(我是这家公司的联合创始人和非执行主席),为大公司提供分析服务。在新冠肺炎疫情期间,负责领导公司的Mike Thompson和Rob Stevens认为,他们的一些客户可能对美国新冠肺炎疫情的预测和分析感兴趣。他们知道,有一些来源可以提供美国县一级的病例和死亡数据,但这些数据都不可预测,至少在当时是这样。因此,First Analytics的团队创建了一个预测模型,该模型使用了《纽约时报》的县级数据,并预测了几周内可能出现的病例和死亡率。该模型考虑了一个州或县的封锁状态以及该地区阳性检测结果的百分比。当然,这种模式会受到监狱或养老院等地方疫情爆发的困扰。

First Analytics曾为领先的动物健康公司Elanco提供分析咨询服务,因此他们联系了这家公司,询问对方是否有兴趣使用新冠肺炎疫情预测服务。该公司分析和其他基于知识的解决方案负责人迈克尔根霍(Michael Genho)表示,他有兴趣谈论这个想法。但是,他的兴趣并不是主要用在Elanco公司,而是针对公司有大量牲畜的客户。新冠肺炎疫情对肉类加工厂的影响尤其大,那里已经有4万例新冠肺炎病例,部分原因是这些地方的社交距离很小。如果一个加工厂关闭或降低其生产能力,就必须屠杀牲畜所有者。

们就会无处可去。在正常情况下,他们会仔细计划,将体重处于最合适区间的牲畜送进加工厂进行屠宰。

Elanco公司自己确实拥有流行病学家,但是这些流行病学家都是专注于动物的。该分析小组通常同商业领袖们合作,用数据和分析帮助他们做出商业决策。该预测模型可以准确预测出即将因为新冠肺炎疫情爆发面临挑战的肉类加工厂。它将这些加工厂分为绿色、黄色和红色三个类别。最好的预测能够提前一两个星期预测到工厂关闭或减产。

这些客户原本只能凭借直觉做出决定,现在他们对预测非常重视,并且要求在每周预测更新之后同Elanco联系。Genho的分析小组还会在预测结果中补充肉类加工厂每周的生产数据以及新出现的工厂关闭、减产以及工厂内出现的新冠肺炎疫情状况。客户可以选择将牲畜转移到其他的设施或者改变牲畜上市的时间窗口。这些客户没有以交互的方式使用面板,但是他们很高兴能够通过Elanco获得预测的结果。

一家消费品公司预测现场销售安全性

一家通过杂货店零售商进行销售的消费品公司担心其在新冠肺炎疫情肆虐地区的商店中的现场销售人员的健康和安全。他们已经于三月份的时候从商店里撤出了自己的人手,但是该公司想要弄清楚他们何时才能安全地返回现场。该公司的分析团队从First Analytics的Rob Stevens那里听说了县级预测模型,并将其用于分析各个商店的情况。分析团队的一位成员将新冠肺炎追踪器——一个基于地点的、针对新冠肺炎病例的内部追踪器安置在公司的工厂和办公室。另一个版本的跟踪器则负责评估商店的安全性;根据每个县新冠肺炎病例的数量,每位现场销售代表负责的商店都会被赋予一个“红色/黄色/绿色”的标签。

该分析小组为该公司的健康、安全和法律团队提供分析结果,后者对结果进行讨论后,决定将哪些信息发送给员工。他们发现预测模型很有趣也很有用,但是他们并不想将预测结果直接发送给员工,因为他们认为这样做可能会很难解释。而且,他们也担心给店铺“绿色”的评分可能会让销售人员放松警惕,在去那些店铺的时候不采取任何防护措施。

数据科学与流行病学的平衡

数据科学和分析团队通过处理新冠肺炎疫情数据,扮演了业余的流行病学专家的角色。在这个过程中,我也学到了一些教训。首先,企业中缺乏足够的流行病学专家可用,因此数据科学家和业务分析专家们可以为决策者们提供有用的信息。他们可能没有接受过流行病学方面的培训,但是数据科学和分析方面的原理可以很容易地应用于这个领域。

但是,考虑到将这些分析结果应用于日常运营所面临的各种挑战,企业可能更愿意为客户——而不是他们内部的员工提供见解。而且,在很多情况下,由于缺乏关于这种流行病的历史数据,在这个不确定的时期,对于决策者们来说,预测性分析不如描述性分析可靠。而且,尽管他们的技能可以应用于流行病学,但是等到新冠肺炎的疫情不再纠缠我们的时候,数据科学和分析人员们都更愿意回到更加传统的领域,例如需求预测和消费者行为分析——我问过的每一个数据科学和分析人员都是这样想的。

IT世界网 www.hnce.org 版权所有 豫ICP备10007855号-1

IT世界网游戏下载基地温馨提示:适度游戏娱乐,沉迷游戏伤身,合理安排时间,享受健康生活

免责声明:本站部分内容、图片来自于网络及其他公共渠道,内容仅供参考。版权归原作者所有,如涉及作品内容、版权和其它问题,请发邮件通知我们,我们将在第一时间处理。