海外最新研究提醒:通用AI诊断误诊率或高达80%
人工智能正以肉眼可见的速度融入我们的日常生活。并且,从生成图像、写文案陪聊,再到健康建议,AI已经不再是年轻人专属的“新玩具”。
日本媒体《日经亚洲》最新一期报道将目光投向中国,关注其蓬勃发展的AI应用生态。报道指出,在老龄化趋势下,AI已成为中国老年人处理日常事务和获得情感支持的新助手。其中,代表性应用包括豆包、DeepSeek、元宝、千问、蚂蚁阿福等。
根据中国互联网络信息中心最新发布的年度报告,当前,中国生成式人工智能用户数量已达6.02亿。
从年龄结构看,19岁以下用户占比最高,50至59岁用户占比10.1%,60岁及以上用户占比5.1%。这意味着,50岁以上用户总量已超过9200万,AI正加速渗透进中老年群体的日常生活。

阿里巴巴与一所老年学校的联合研究发现了一个有趣现象:虽然老年人对AI的初始接受度较低,但一旦开始使用,往往表现出更高的忠诚度和使用频率。
以广西的陈女士为例,63岁的她已是AI应用的活跃用户。她告诉记者,平时已习惯用AI识别公园里的花卉、让AI帮忙阅读说明书上的小字、分摊社交活动费用、用AI生成照片轮播视频。
这位陈女士说,“大部分时间都不需要依赖我的孩子。”
像陈女士这样的老年用户并非个例。为顺应这一趋势,国内许多老年大学已开设相关课程,教老年人如何使用AI工具进行聊天、制作视频和撰写文章。在太原的一所老年人大学里,老人们正在认真学习如何使用智能手机和各类AI应用。

然而,AI应用的快速普及也暴露出另一面问题——在严肃的医疗健康领域,通用AI提供的不准确诊断正成为全球关注的一大挑战。
据《日经亚洲》报道,美国麻总百瀚医疗系统(Mass General Brigham)的一项最新研究,对OpenAI、Anthropic、Google、xAI和DeepSeek等21种通用大模型进行了测试。研究人员让这些模型处理29个临床案例,结果显示:当患者数据完整时,通用AI确实擅长得出准确的最终诊断;但当数据不完整——这恰恰是真实问诊中的常态——误诊率可能超过80%。
业内专家指出,通用AI在开放域对话中表现出色,但在医疗健康等高门槛专业场景中,其推理能力仍有明显局限。对于普通用户而言,日常咨询可以使用通用AI,但涉及健康诊断等严肃问题时,选择经过专业训练的垂直AI或咨询真实医生,仍然是更稳妥的选择。