问:

论文伪造数据如何看出

答:
论文数据是否真实是判断论文质量的一个重要方面。论文数据如果伪造或manipulate,会导致论文结论的不可靠性,所以评审者和读者需要注意一些迹象,判断论文数据的真实性。
首先要看样本量和数据分布的合理性。样本量过小,或某一分类中的样本占比过大,都可能是manipulate数据的迹象。数据分布过于规则(如正态分布过于理想)也值得怀疑。
其次要注意数据和统计结果的一致性。如果研究者报告的统计量(如平均值、标准差等)与原始数据不符,或不同表格/图表中的统计结果明显不一致,均可能表明数据被操纵。
再要关注研究过程的透明度。研究过程不够清晰和连贯,无法复现实验时,研究者操纵数据的可能性更大。有选择地报告部分结果,或隐藏关键的实验细节都不利于判断数据的真实性。
数据的质量和一致性也很重要。如果数据格式和精度变化过于规则,或不同来源的测量结果相关度过高时,都值得怀疑。图像或图表中的趋势或质量过高也可能是数据被“修饰”的信号。
此外,研究者和研究机构的可信度也影响判断。来自知名期刊和机构、研究者具有完善学术背景的研究,其报告数据的可信度会更高。而学术不端事件的相关人员及机构所报告的数据,其真实性需要更严密判断。
综上,判断论文数据真实性需要结合研究设计、样本特征、统计结果、研究过程的报告是否连贯、数据质量与一致性等多方面因素。没有任何一点可以作为判断的决定性证据,但多方面因素呈现出不利于研究可信度的趋势时,则有理由对研究报告的数据真实性提出质疑。