万维读者网 > 信息时代 > 正文  

重大突破!ChatGPT首次通过神经科考试

www.creaders.net | 2023-12-11 22:18:44  FX168财经 | 0条评论 | 查看/发表评论

  OpenAI公司旗下最新研发的大型语言模型ChatGPT 4.0已通过临床神经学考试,在概念验证研究中回答了85%的正确答案。研究作者认为,经过一些微调,ChatGPT就可以在临床神经病学中具有“重大应用”。当前,人工智能(AI)已在为阿斯利康寻找癌症治疗方法,还有对抗香港抗生素的过度处方。

  这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布,该测试于5月31日进行,测试对象包括两个大型语言模型,即ChatGPT 3.5及其更高版本ChatGPT 4.0。

  研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库,以及欧洲神经病学委员会的一小部分问题。

  旧版本的ChatGPT得分为66.8%,正确回答了1956个问题中的1306个问题,而较新的版本ChatGPT 4.0得分为85%,正确答案为1662个。

  值得关注的是,普通人类平均得分为73.8%。这意味着,ChatGPT 4.0的能力已超越了人类平均。

  ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户,并有效“通过”了神经学考试,因为70%的正确答案通常被教育机构视为及格分数。

  然而,这两种模型在需要“高阶思维”的任务中的表现,都比仅需要“低阶思维”的问题表现得更弱。

  根据进行实验的研究人员小组的说法,这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。

  他们指出:“这些发现表明,通过进一步完善,大型AI语言模型可以在临床神经病学中具有重要的应用。”

  研究人员指出,目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景,但神经学家应该谨慎对待它们在实践中的使用,因为它们在高阶认知任务方面仍然不完善。

重大突破!ChatGPT首次通过神经科考试

  该研究的作者之一Varun Venkataramani博士在接受采访时表示:“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”

  “AI语言模型仍然需要发展,甚至可能需要进行具体的微调,以使其正确适用于临床神经病学,”他补充道。

  实际上,当前AI已经在致力于医疗保健领域的一些重大任务,例如为阿斯利康寻找癌症治疗方法,或是对抗香港抗生素的过度处方。

   0


24小时新闻排行榜 更多>>
1 突发:全球最大光刻机巨头爆雷 股价跳水
2 华尔街大鳄警告 它是一个“巨大的泡沫”
3 余茂春惊人预告 习近平的噩梦要来了
4 火箭军又将大地震?习四个字批示
5 复旦研究生珠峰地区登山死亡 真相更令人愤

48小时新闻排行榜 更多>>
1 北京扣动扳机 人民币贬值开始了
2 撤出中国,苹果跑的也太快了
3 铁拳再现!中国将禁止公布这些数据
4 不好,爆雷越来越密集了
5 中共情色档案中的薄熙来情妇有名有姓
6 重庆,又一次刷新了底线
7 突发:全球最大光刻机巨头爆雷 股价跳水
8 这一幕,终于在深圳上演了
9 华尔街大鳄警告 它是一个“巨大的泡沫”
10 拜登祭出重招 堵上北京这个漏洞
热门专题
1
以哈战争
6
中共两会
11
秦刚失踪
2
中美冷战
7
台湾大选
12
火箭军悬案
3
乌克兰战争
8
李克强猝逝
13
台海风云
4
万维专栏
9
中国爆雷
14
战狼外交
5
美国大选
10
李尚福出事
15
普里戈津
一周博客排行 更多>>
1 习近平一盘神秘大棋成就了大日 文庙
2 周傥:美国迫在眉睫的危险 万维网友来
3 速战速决 伊朗真乃大丈夫也 体育老师
4 康生的儿子死了/漂亮国的象征 体育老师
5 达唐:故宫博物院遭公开举报 万维网友来
6 谁是中国人? 谢盛友文集
7 现代战争目的:摧毁战争意志 施化
8 日本电影《追捕》中的杜丘和真 弓长贝占郎
9 辛峰:特鲁多为什么不信加拿大 万维网友来
10 前瞻:习马再相会 花蜜蜂
一周博文回复排行榜 更多>>
1 川普就是美国的毛泽东 右撇子
2 前瞻:习马再相会 花蜜蜂
3 警惕有人把民主党与共和党的关 karkar
4 美国为何选择这个时候公布中共 山蛟龙
5 周傥:美国迫在眉睫的危险 万维网友来
6 习近平一盘神秘大棋成就了大日 文庙
7 现代战争目的:摧毁战争意志 施化
8 抖音在大选年被禁的可能性不大 随意生活
9 去......化 山蛟龙
10 康生的儿子死了/漂亮国的象征 体育老师
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. CyberMedia Network/Creaders.NET. All Rights Reserved.