海外最新研究提醒：通用AI诊断误诊率或高达80%

来源：互联网时间：2026-04-15 19:24:45

人工智能正以肉眼可见的速度融入我们的日常生活。并且，从生成图像、写文案陪聊，再到健康建议，AI已经不再是年轻人专属的“新玩具”。

日本媒体《日经亚洲》最新一期报道将目光投向中国，关注其蓬勃发展的AI应用生态。报道指出，在老龄化趋势下，AI已成为中国老年人处理日常事务和获得情感支持的新助手。其中，代表性应用包括豆包、DeepSeek、元宝、千问、蚂蚁阿福等。

根据中国互联网络信息中心最新发布的年度报告，当前，中国生成式人工智能用户数量已达6.02亿。

从年龄结构看，19岁以下用户占比最高，50至59岁用户占比10.1%，60岁及以上用户占比5.1%。这意味着，50岁以上用户总量已超过9200万，AI正加速渗透进中老年群体的日常生活。

阿里巴巴与一所老年学校的联合研究发现了一个有趣现象：虽然老年人对AI的初始接受度较低，但一旦开始使用，往往表现出更高的忠诚度和使用频率。

以广西的陈女士为例，63岁的她已是AI应用的活跃用户。她告诉记者，平时已习惯用AI识别公园里的花卉、让AI帮忙阅读说明书上的小字、分摊社交活动费用、用AI生成照片轮播视频。

这位陈女士说，“大部分时间都不需要依赖我的孩子。”

像陈女士这样的老年用户并非个例。为顺应这一趋势，国内许多老年大学已开设相关课程，教老年人如何使用AI工具进行聊天、制作视频和撰写文章。在太原的一所老年人大学里，老人们正在认真学习如何使用智能手机和各类AI应用。

然而，AI应用的快速普及也暴露出另一面问题——在严肃的医疗健康领域，通用AI提供的不准确诊断正成为全球关注的一大挑战。

据《日经亚洲》报道，美国麻总百瀚医疗系统（Mass General Brigham）的一项最新研究，对OpenAI、Anthropic、Google、xAI和DeepSeek等21种通用大模型进行了测试。研究人员让这些模型处理29个临床案例，结果显示：当患者数据完整时，通用AI确实擅长得出准确的最终诊断；但当数据不完整——这恰恰是真实问诊中的常态——误诊率可能超过80%。

业内专家指出，通用AI在开放域对话中表现出色，但在医疗健康等高门槛专业场景中，其推理能力仍有明显局限。对于普通用户而言，日常咨询可以使用通用AI，但涉及健康诊断等严肃问题时，选择经过专业训练的垂直AI或咨询真实医生，仍然是更稳妥的选择。

海外最新研究提醒：通用AI诊断误诊率或高达80%

相关阅读

相关下载