近日,美国知名癌症研究机构丹娜法伯(Dana-Farber)被曝出疑似大规模数据造假丑闻,引发了科学界的公信力危机。
去年夏天,我在哈佛商学院报道了弗朗西斯卡·吉诺(Francesca Gino)的故事。 她被指控在她发表的至少四篇文章中公然伪造数据。 事件之所以被曝光,是因为一位关注研究诚信的业余“数据侦探”在互联网上发现他的**数据可疑,展开了进一步的调查。
他们最终将担忧上报给哈佛大学,经过调查,哈佛大学要求撤回此案。 吉诺随后对哈佛大学和博客作者提起诉讼,指控他们密谋诽谤她。 )
当我读到波士顿哈佛大学附属癌症研究医院Dana-Farber发生的类似丑闻时,我不禁想起了吉诺的案例。
今年1月,分子生物学家和在线“数据侦探”Sholto D**ID在他的博客上发表了一篇文章,指责该机构在几项癌症研究中伪造数据**,包括医院首席执行官和首席运营官的研究。 据报道,D**ID 联系了该机构,对 57** 提出质疑,其中 38 项“可能对重大数据错误负责”。 目前,该机构已要求撤回其中6项**,并启动了31项**的纠正程序。
需要注意的是,这些数据操作并不复杂。 (D**id在他的博客中称这些证据是“业余的和拙劣的”。 他指出,许多情况都涉及在不同的图表中重复使用相同的图像,只是更改标签,以及图像的旋转或拉伸不佳。 不同日期的实验数据曲线奇怪地相同,测试结果明显是复制粘贴的。
这就引出了一个问题:如果复制粘贴的图像背后确实存在某种不当行为,为什么相关人员如此厚颜无耻地在公众眼中进行如此明显的伪造这么长时间? 有多少研究经费是基于虚假数据? 在这些病例中传播的错误信息将在多大程度上对抗癌产生负面影响?
更重要的是,这只是冰山一角吗?
癌症数据欺诈丑闻剖析
多年来,生物医学研究人员已经意识到该领域的图像欺诈问题。 2016 年,荷兰微生物学家伊丽莎白·比克 (Elisabeth Bik) 扫描了 20,000 多篇生物医学**文章,以寻找这种操纵的证据,并发现了 38%的**显示出相关的迹象,其中“至少一半显示出故意操纵的特征”。 更令人担忧的是,这个问题似乎正在上升。 Vic发现,“在过去十年中,出现在**中的问题图像的百分比显着增加”。
她描述操作的量表包括三种类型的图像伪造:同一图像被使用两次,标签不同(这可能是无意的错误),同一图像被使用两次,但其中一个被裁剪(这似乎不太可能是无意的错误),以及图像被粘贴了其他东西(这极不可能是无意的错误)。
因此,生物医学科学家早就意识到了这个问题。 D**id 博客文章中强调的一些具体操作在科学家圈子里是众所周知的,并在论坛 Pubpeer 上引发了激烈的辩论。 然而,尽管存在长期的担忧,但事实证明,正是 D**ID 的这篇博文促使了撤稿和内部调查。
错误的后果
像 Gino 和 Dana-Farber 这样的案件需要外部“数据侦探”的参与,这令人不安。 从事“数据侦探”工作不仅有回报,也有风险。 正如他告诉《卫报》的那样,D**ID目前处于失业状态,只能利用空闲时间在兼职工作之间标记数据操纵。
许多“数据侦探”因揭露数据欺诈而受到诉讼的威胁。 去年夏天,诽谤律师肯·怀特(Ken White)告诉我,“许多重要的科学发现不是由受到质疑的大机构做出的,而是由像这样的独立人士做出的。 “问题在于,除非有人提出要求,否则没有可以审查的制度程序**——大多数科学家不愿意冒着职业风险来做这样一项吃力不讨好的工作。
另一个令人不安的方面是,这种伪造是如此明目张胆。 我们不是在谈论复杂的数据操作,而是科学家对结果的拙劣的 Photoshop 过程。 “我们看到的只是学术欺诈的冰山一角——*数据复制是科学家的最后手段,他们没有最好的技能,在没有其他可用的情况下获得预期的结果,”D**ID在他最初的博客文章中写道。 在一个实验结果经常被Photoshop处理的文化中,这不可能是唯一的操纵手段。
吉诺事件和达娜-法伯事件有一个共同点:哈佛大学。 从吉诺的案件,到哈佛大学校长克劳丁·盖伊(Claudine Gay)的辞职,再到现在被指控的癌症研究欺诈,哈佛大学作为卓越学术机构的声誉无疑受到了沉重打击。
然而,在美国最负盛名的顶尖大学中发现这些挑战也引起了公众对这一紧迫问题的关注。 也许,哈佛的尴尬会引发变革。