研究显示 ChatGPT 可为科学假说生成虚假数据集，对学术诚信造成威胁

愤怒的蜗牛

2023-11-25 716阅读 0评论

研究显示 ChatGPT 可为科学假说生成虚假数据集，对学术诚信造成威胁

11 月 24 日消息，据《自然》杂志当地时间周三报道，本月初发表在《美国医学会眼科学杂志》上的一篇论文中，作者使用了聊天机器人 GPT-4 和高级数据分析工具 ADA 创建了一个虚假的临床试验数据集，从而支持一个“未经证实”的科学主张。

IT之家注：ADA 是一种结合了 Python 的模型，可用来执行统计分析、创建可视化数据。

报道称，论文作者要求 GPT-4 和 ADA 生成一个有关角膜炎患者的数据集，并让它支持“深层前部角膜移植（DALK）在视力和眼睛成像测试方面比穿透性角膜移植（PK）效果更好”的结论。

由 AI 生成的数据包括 160 名男性参与者和 140 名女性参与者的实验结果，并支持了上述结论，然而这个结果与真正临床试验显示的结果不符。

专家对该虚假数据集进行了详细检查，并发现其中存在明显捏造迹象。英国曼彻斯特大学生物统计学家杰克・威尔金森表示，“要创建至少表面上看似可信的数据集似乎很容易，在未经训练的人看来，这‘肯定是’一个真实的数据集。”

参与这份研究报告的作者承认，这一数据集在经过“仔细观察”之后就可发现其中存在的缺陷，但如果读者快速查看这些数据集的话，就“很难识别出”数据中的非人类来源。

由 AI 编造的“可信数据”增加了研究人员和期刊编辑对学术研究诚信的担忧。《EMBO Reports》杂志主编 Bernd Pulverer 表示，“现实中的同行评审往往不会对数据进行全面的重新分析，因此不太可能发现利用人工智能精心设计的完整性漏洞。”他补充说，期刊需要更新质量检查，以识别 AI 生成的合成数据。

无人机是如何工作的?

最新Claude 200K严重「虚标」？大神壕掷1016美元实测，90K后性能急剧下降

相关阅读

ACL 2025 | 基于Token预算感知的大模型高效推理技术

OpenAI久违发了篇「正经」论文：线性布局实现高效张量计算

被疯传的“恶趣味”：看Copilot这款“熊孩子”把微软工程师逼疯！Agent 刚上线就翻车？网友：微软工程师成了“人肉保姆” 译文

1步碾压250步！何恺明新作祭出MeanFlow，一行公式让 FID 狂降近 70%

奥特曼：Codex 让我感到 AGI！最新谈话罕见透露下一代“完美模型”，大胆预测 Agent 明年突破边界！

OpenAI深夜宣布ChatGPT支持MCP、会议记录，万物互联时代来了！

使用Claude 4提升程序员生产力的五种高级方式译文

AI+数字经济的核心三要素

您需要登录账户后才能发表评论

发表评论取消回复

评论列表（暂无评论，716人围观）

还没有评论，来说两句吧...

目录[+]

微信二维码

微信二维码

支付宝二维码