您当前的位置: 首页 >  博客资讯

科研诚信大调查:人类最伟大创造活动的根基有多脆弱?

学术研究是人类伟大创造活动之一,然而其根基――科研诚信,在学术完全职业化的当代社会不断遭到挑战。今天,距欧美国家着手建设科研诚信已过去三十余年,中国在这一道路上也走了十多年,那么学术不端的行为有所收敛了吗?本文用若干调查数据和案例回答这一问题。

撰文 | 小叶

在任何一国,科研诚信都是学术共同体和整个国家立足、发展的根基。上世纪90年代,科技领先的欧美国家开始构建科研诚信的原则和规范,纷纷成立科研诚信研究和监督机构,颁布相关公共政策。最近十多年来,中国也逐步建立科研诚信相关的制度和体系,学术界对学术不端行为的关注度也大大增强。那么这么多年过去了,如今学术不端行为有所收敛了吗?

生医界的图片或数据“误用”

2015年,顶级医学杂志《柳叶刀》(The Lancet)曾在一篇社论里悲观地称:“我们人类最伟大创造活动的根基已出现问题……大部分科学文献,也许将近一半,都可能是虚假研究。”[1]同年,英国医学科学院(British Academy of Medical Sciences)发布题为《生物医学研究的可复现性和可靠性:科研实践改良》(Reproducibility and reliability of biomedical research: improving research practice)的报告。报告称,在生物医学的某些领域,虚假的科学发现可能高达69%[2]。

最典型的例子之一可谓哈佛医学院心肌再生领域的“大牛”Piero Anversa,他于2018年被爆出学术造假,31篇顶刊文章被撤。此君从2001年开始,坚持不懈地伪造或修改实验数据,用虚假发现直接“开辟”出一个新的医学研究领域,而其“开创”的领域十几年来跟风者甚众,发表的“研究结果”难以胜数。

著名学术打假人Elisabeth Bik从2013年开始自己的打假事业,主要工作是甄别论文中重复用图和图片篡改情况。2016年,她和同事发表文章,将仅重复用图这一不端行为有多泛滥的情况通报给了公众[3]。她们使用“蛋白免疫印迹”(Western Blot)为关键词,搜索出1995年-2014年发表在40本科学期刊上的20621篇论文,通过肉眼鉴别,加上计算机工具交叉分析论文中的图片,结果发现,3.8%的论文包含至少一张问题图片,而其中至少一半的问题图片有明显的刻意篡改特征。

2021年7月24日,Bik曾在个人推特上发过一条简单的“大家来找茬”挑战,你能不能找出几幅图片中的重复之处呢?|来源:Elisabeth Bik 推特

迄今为止,Bik的打假行动卓有成效:519篇论文撤稿,74条关注申明,452条论文修正申明[4]。她还在同行评议网站PubPeer.com上报道了约3500篇涉嫌学术不端的论文[5]。

学术不当行为普遍性惊人

不难承认,生物医学界的学术不端状况可谓十分严重,那么其他领域呢?

首先需要说明一下,关于学术不端行为,全球并没有统一的界定标准。目前,全球学界公认的三大最严重的学术不端行为是伪造(Fabrication)、篡改( Falsification)和抄袭( Plagiarism),简称FFP 。而2019年,中国国家新闻出版署正式发布并实施我国首个针对学术不端行为(即research misconduct)的行业标准《学术出版规范――期刊学术不端行为界定(CY/T174-2019)》[6],将学术不端行为明确划分为8种类型:剽窃、伪造、篡改、不当署名、一稿多投、重复发表、违背研究伦理及其他。

中国首个学术不端行为行业标准前言 | 来源:www.cdutcm.edu.cn

除此以外,对一些因缺乏严谨的治学态度而介于合规和不端之间“灰色地带”的行为,学界一般视为“有问题的学术不当行为”(Questionable Research Practices,以下简称QRPs),例如忽略研究的负面结果、夸大学术成果的意义和作用等。

2021年6月29日,中国科学技术大学孔燕教授团队在《科学和工程学伦理》(Science and Engineering Ethics)杂志上发表了一篇荟萃分析研究。其估计,所涵盖的论文中,犯有FFP中至少一种行为的比例为2.9%(95%置信区间2.1-3.8%),而涉及至少一种QRPs的比例则为12.5%(95%置信区间10.5-14.7%)。此外,15.5%(95%置信区间12.4-19.2%)的研究人员见证过其他人做出至少一种不端行为,而39.7%(95%置信区间35.6-44.0%)的人见证过其他人犯有至少一种不当行为。[7]

2020年10月到12月,荷兰国家科研诚信调查(Dutch National Survey on Research Integrity,以下简称NSRI)展开了目前为止规模最大的学术不端与不当行为问卷调查,共有64000多名科研人员受邀参与匿名问卷调查,他们来自各个学术领域,包括理工科以及人文学科,涉及荷兰22所高校和科研机构。虽然很多机构因担心负面声誉而拒绝合作,但最后仍然收回了6813份完整的问卷回复(回复率为21.2%),这个数量还是比先前的诚信研究样本量大很多。

NSRI这项调查的结果于今年7月发表在预印本网站MetaArxiv上[8, 9]。研究人员将学术不端行为限定为伪造和篡改(即FF),另外还界定了11条QRPs(见下图,点开放大可见),涵盖了实验技能、实验设备、对初级研究人员的监督指导、论文规范等方面。结果显示,NSRI的统计比孔燕团队的估计值还高:在给出回复的科研人员中,8.3%的人承认自己从2017年至2020年,至少伪造或者篡改过一次实验数据,而生命科学和医学领域仍然是FF与QRPs的重灾区(分别为10.4%和55.3%)。与此同时,11种QRPs中最普遍的五大行为分别是:

- 不发表结果为阴性的研究(17.5%)

- 论文中对研究的缺陷和局限总结得不充分(17%)

- 对初级研究人员的监督及指导不足(15%)

- 对设备、技能或专业知识的关注不足(14.7%)

- 研究过程中笔记记录不足(14.5%)

报告给出的11条QRPs以及论文作者不同领域、身份的总体统计情况。|来源:doi:10.31222/osf.io/vk9yt

总而言之,除了8.3%的伪造、篡改(FF)之外,51.3%的受访者会犯至少一次QRP。其中,在读博士生和初级研究人员犯有QRP的比例高于副教授和正教授级别的科学家。但这个数字仍有可能低于实际情况――英国伦敦经济学院(London School of Economics)的研究伦理学家Daniele Fanelli认为,荷兰的调查对科研行为的定义并非直接明确,还是给受访者的某些“模棱两可”行为留下了“看似没有问题”的解释空间,“因此可能有些受访者的回答并非那么诚实。”

Elisabeth Bik倒不惊讶于这样的结果。她认为,调查中提到的许多不当行为,甚至一些严重的不端行为,不应该总是如此黑白分明。“从研究结果中排除掉一个异常值,已属于伪造,但有时候你却有充分理由这么做。发表阴性结果的论文其实非常困难,因为许多期刊就是不感兴趣。所以,制定诚信行为规范,三思而后行是好事,但无法时刻固守这些规则,也不代表你是个彻头彻尾的‘坏科学家’。”[10]

此外,为了搞清受访者为何做出不端或不当行为,研究团队询问了他们的科研经历、是否感觉到科研压力或者同行压力等,并在调查中列出10条导致学术不端或不当行为的解释因素。结果发现,论文发表压力与不端或不当行为的相关性最显著。而可制止学术不端行为的最大因素则是被同行评审发现问题的机率。

造假丑闻后,荷兰痛定思痛

荷兰展开如此大规模的科研诚信研究,起因可以追溯回10年前荷兰心理学家Diederik Stapel震惊世界的学术造假丑闻。

荷兰蒂尔堡大学(Tilburg University)原社会心理学教授Diederik Alexander Stapel |来源:alchetron.com

2011年,Stapel被两名研究生举报涉嫌数据造假,经多方调查发现,他至少在55篇论文以及10篇博士论文中有造假行为,这些无辜的博士生被牵连,研究统统作废。

Stapel的学术丑闻是对整个心理学界的致命一击。在被揭发前,他之所以能平安无事,甚至凭借“虚假研究”平步青云,成为全球知名的学术大师,与“业内在分析数据时普遍存在的粗心、刻意筛选数据,以及不客观分析数据”脱不了关系。

Stapel深谙科学编辑喜欢“漂亮”论文的心理。他曾说过:“我从不研究奇奇怪怪的课题,哪怕我在背后操纵,我总是会检查好我的实验合理性,会有其他实验结果支持。而我不过是踏出了每个人都在期待的那一步。我的实验假设都基于大量相关文献,只有这样,我的结果才令人信服。大家都希望看到有创意的研究,你得有本事证明,你的研究不仅富有创意,还符合人们直觉,从而‘真实可信’”。[11, 12]

自此之后,荷兰学界痛定思痛,努力走在改进科研诚信的前沿。2018年,荷兰各大合作院校和机构共同发布了《荷兰诚信研究行为准则》(Netherlands Code of Conduct for Research Integrity)[13],明确了好的科研行为标准,从实验设计、操作到最后的结果报告,方方面面都要求恪守“诚实、严谨、透明、独立、责任”的科研诚信原则,从而表明了对诚信议题高度重视的决心。

但很显然,“重视”不足以消除大家都不愿意看到的错误行为。NSRI的调查结果说明,科研诚信的大环境仍然阴霾重重,至少在荷兰如此。

保卫科研净土的路该怎么走?

科学追求真理,科学实验却不一定是通往真理的平坦大道,它会有分叉:一条指向真理,但也许灰暗无趣,还遍布荆棘,道路艰难;而另一条指向荣耀,造假的结果虽然是错误的,但一旦被接受、被认可,名利双收,有多少人能拒绝呢?自始至终,科学研究都不仅仅是纯粹的探索活动。

2020年新冠疫情期间,Bik打假了法国微生物学家Didier Raoult就羟氯喹与阿奇霉素组合用药可有效治疗新冠肺炎的问题论文,遭遇对方起诉[14]。这一风波至今未能平息。Bik的态度非常鲜明:“无论一个假设多么吸引人,只要有足够强大的证据证伪,好的科学家都应该抛弃这一假设。但是,面对全球疫情,有一些科学家确实希望自己的发现或发明能拯救更多生命,同时也能让自己声名大噪。”[4]一个良好的愿景和科研出发点,最终却以不端行为收场,辜负了全球人民的期盼。

以上种种事实让我们看到:科学家原本应该做出“负责任的科学研究”,但是,“有问题的科研行为”普遍存在,甚至发展成“故意的不端行为”,这是一个连续恶化的过程。而近来,在人工智能技术的帮助下,学术不端更是结出最新“恶果”。(参见《计算机领域惊爆论文“花式造假”,中国作者频现可疑期刊)

应对这一“科学病毒”及其“恶之果实”,国际学界目前仍主要依靠评审专家的学术判断、读者或者同行的揭发举报、学术伦理规范的引导以及反剽窃系统的运作去祛除毒瘤。但是,揭发之后的调查、确认之后的惩罚,以及更明晰更严格的规范标准等方面都有待进一步完善。

欧美学界历经30多年,科研诚信建设还远未成功。我国从2007年科学技术部正式建立科研诚信建设办公室起,大力推进相关政策的制定和落实,至今在治理学术不端上仍然任重而道远。建立“洁净”的科研环境,让学术诚信成为科技发展的坚实基础,需要我们正视事实,始终秉持与学术不端斗争到底的勇气和决心,如此才能引导科研人员“返朴归真”,让年轻一代做出“负责任的科学研究”,让科学继续得到大众的信任、尊重,并惠及于民。

参考文献

[1] https://www.thelancet.com/journals/lancet/article/PIIS0140-6736(15)60696-1/fulltext?rss%3Dyes

[2] https://www.sott.net/article/455428-Trust-the-science-but-how-much-scientific-research-is-actually-fraudulent

[3] https://journals.asm.org/doi/full/10.1128/mBio.00809-16

[4] https://www.theguardian.com/science/2021/aug/03/microbiologist-elisabeth-bik-queried-covid-research-thats-when-the-abuse-and-trolling-began

[5] http://news.sciencenet.cn/htmlnews/2020/7/443068.shtm

[6] https://www.cdutcm.edu.cn/Upload/kjc/ContentManage/Article/File/2020/11/23/202011231026512298.pdf

[7] https://link.springer.com/article/10.1007/s11948-021-00314-9

[8] https://osf.io/preprints/metaarxiv/vk9yt/

[9] https://osf.io/preprints/metaarxiv/xsn94/

[10] https://www.sciencemag.org/news/2021/07/landmark-research-integrity-survey-finds-questionable-practices-are-surprisingly-common

[11] https://www.nytimes.com/2013/04/28/magazine/diederik-stapels-audacious-academic-fraud.html

[12] https://www.guokr.com/article/437083

[13] https://www.vsnu.nl/files/documents/Netherlands%20Code%20of%20Conduct%20for%20Research%20Integrity%202018.pdf

[14] https://www.nature.com/articles/d41586-021-01430-z