Excel正在自动更正科学研究

导读 由于自动更正或自动完成功能,您发送或接收的邮件出现乱码的可能性很大。这些错误导致沟通混乱的模因有数百种,通常会带来搞笑的结果。喜欢

由于自动更正或自动完成功能,您发送或接收的邮件出现乱码的可能性很大。这些错误导致沟通混乱的模因有数百种,通常会带来搞笑的结果。喜欢这个。还是这个。还是这个。

但是,当您的科学论文发生时,这并不是那么有趣。学术论文经常包括补充文件,这些文件带有支持论文结论的数据,图表和图形。这些文件很多都是电子表格。

自2004年以来,科学家注意到流行的电子表格程序Microsoft Excel具有将某些基因名称更改为其他类型数据的不良习惯。例如,遗传学家使用MARCH1作为膜相关的无环CH型手指1的简写。但是Excel将MARCH1解释为日期,并自动将其转换为1月3日或3月1日的另一个名称。

Excel将其他一些基因名称误识别为坐标或浮点数。您也许可以怀疑1-Mar实际上是MARCH1,但是2.31E + 13呢?这就是Excel转换RIKEN标识符2310009E13的方式。RIKEN是日本的大型研究机构,除其他外,它从事基因组计划。(为记录起见,我们尝试将RIKEN标识符插入Excel电子表格,并自动将其转换为2.31E + 19,这仍然是错误的,仍然不是这些学术论文的目的。)

尽管研究人员早在十多年前就首次发现了这个问题,但这一问题一直持续到今天。研究人员Mark Ziemann,Yotam Eren和Assam El-Osta筛选了35,000多个补充文件,以查看问题的严重程度。他们开发了自动软件,可以搜索看起来像基因名称列表的任何数据。他们确定了7467个基因列表,这些基因列表代表18种不同期刊上3597篇论文的补充数据。原来有704篇已发表的论文中包含Excel格式错误的文件。失败率为19.6%。换句话说,几乎五分之一的已发表论文中都包含带有Excel格式错误的补充文件。

这不仅是不便。研究人员依靠已发表的作品来指导自己的项目。如果文件包含错误,则找出问题并找到相关数据可能很困难且耗时。

为什么不关闭自动格式化功能呢?根据研究小组的说法,无法永久禁用Excel中的功能。每次创建新文件时,您都可以手动更改每个选项,但这效率低下。他们确实指出,但是Google表格没有采用相同的格式设置方法。此外,如果您首先将所有数据放入Google表格中,然后将其复制到其他电子表格程序中,则格式将保持不变。

旨在帮助人们使用电子表格的功能在学术界引起了如此头痛,这有点可笑。也许将来的Excel版本将包含一个选项,用于无限期禁用自动格式化功能。在此之前,遗传学家应仔细检查他们的工作,或考虑改用Google表格。