万维读者网 > 信息时代 > 正文  

重大突破!ChatGPT首次通过神经科考试

www.creaders.net | 2023-12-11 22:18:44  FX168财经 | 0条评论 | 查看/发表评论

  OpenAI公司旗下最新研发的大型语言模型ChatGPT 4.0已通过临床神经学考试,在概念验证研究中回答了85%的正确答案。研究作者认为,经过一些微调,ChatGPT就可以在临床神经病学中具有“重大应用”。当前,人工智能(AI)已在为阿斯利康寻找癌症治疗方法,还有对抗香港抗生素的过度处方。

  这项实验结果由海德堡大学医院和海德堡德国癌症研究中心的一组研究人员于12月7日发布,该测试于5月31日进行,测试对象包括两个大型语言模型,即ChatGPT 3.5及其更高版本ChatGPT 4.0。

  研究人员使用了美国精神病学和神经病学委员会的神经病学考试题库,以及欧洲神经病学委员会的一小部分问题。

  旧版本的ChatGPT得分为66.8%,正确回答了1956个问题中的1306个问题,而较新的版本ChatGPT 4.0得分为85%,正确答案为1662个。

  值得关注的是,普通人类平均得分为73.8%。这意味着,ChatGPT 4.0的能力已超越了人类平均。

  ChatGPT 4.0在行为、认知和心理相关问题上的表现优于人类用户,并有效“通过”了神经学考试,因为70%的正确答案通常被教育机构视为及格分数。

  然而,这两种模型在需要“高阶思维”的任务中的表现,都比仅需要“低阶思维”的问题表现得更弱。

  根据进行实验的研究人员小组的说法,这些结果可以作为在一些修改后在临床神经病学中使用ChatGPT的建议。

  他们指出:“这些发现表明,通过进一步完善,大型AI语言模型可以在临床神经病学中具有重要的应用。”

  研究人员指出,目前仍存在一些保留意见。尽管在文档和决策支持系统中应用ChatGPT有一个明确的前景,但神经学家应该谨慎对待它们在实践中的使用,因为它们在高阶认知任务方面仍然不完善。

  该研究的作者之一Varun Venkataramani博士在接受采访时表示:“我们将目前的研究更多地视为对ChatGPT能力的概念验证。”

  “AI语言模型仍然需要发展,甚至可能需要进行具体的微调,以使其正确适用于临床神经病学,”他补充道。

  实际上,当前AI已经在致力于医疗保健领域的一些重大任务,例如为阿斯利康寻找癌症治疗方法,或是对抗香港抗生素的过度处方。

   0


24小时新闻排行榜 更多>>
1 今夜,终于等来大好消息
2 习在军中只信她 军报罕见痛骂…
3 传三中全会再收割 中产返贫势加剧
4 要大转弯?习借他之口放风
5 要么中国自己解决,要么我们动手

48小时新闻排行榜 更多>>
1 板上钉钉!习主席这个锅肯定是甩不掉了
2 习近平一经宣布,立即炸锅
3 今夜,终于等来大好消息
4 “妈妈坐高铁,下车发现屁股后面湿了”
5 习在军中只信她 军报罕见痛骂…
6 传三中全会再收割 中产返贫势加剧
7 要大转弯?习借他之口放风
8 要么中国自己解决,要么我们动手
9 北约峰会下狠手 给北京准备了这四剂猛药
10 7年来Costco首度上调会员年费 一口气上涨
热门专题
1
巴黎奥运
6
中美冷战
11
中国爆雷
2
三中全会
7
乌克兰战争
12
李尚福出事
3
美国大选
8
中共两会
13
秦刚失踪
4
万维专栏
9
台湾大选
14
火箭军悬案
5
以哈战争
10
李克强猝逝
15
台海风云
一周博客排行 更多>>
1 曾华
2 中美关系态势格局 阿妞不牛
3 先声夺人、千里摄敌、不战而胜 万维网友来
4 身边的朋友,最近有几对离婚了 平等性
5 开明形象惹猜忌 习近平剑指汪 胡亥
6 冬天的童话 㨗克篇(四 野狼巴克
7 撕下中共执政的最后一块合法性 思芦
8 回了一趟北京(4)杂谈(1) 芨芨草
9 漫谈过度自信导致中国内外交困 中国社会经
10 回复 阿妞不牛:后中共时代的 遍地是贪官
一周博文回复排行榜 更多>>
1 中美关系态势格局 阿妞不牛
2 回复 阿妞不牛:后中共时代的 遍地是贪官
3 太上总统为了败家子不惜对抗全 must
4 宪法的解释权应该归谁? suoliweng
5 北约正式开启亚太扩容 随意生活
6 撕下中共执政的最后一块合法性 思芦
7 作孽啊,埋没毕汝谐事小,拯救 汝谐毕
8 中美对比:房贷断供后 马黑
9 华人与美加政治——美国总统“ 高天阔海
10 从马教授的演讲看共军梧桐台湾 随意生活
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. Creaders.NET. All Rights Reserved.