![]() |
|
现在人碰到问题,第一直觉反应就是问 AI!但是到底哪一个 AI 工具才最准确?或许每个人都有不一样的感受,对此英国消费者组织《Which?》就联合专家,针对六组常见的 AI 工具进行实测,结果 Gemini、ChatGPT 都无法获得最高分。
《Which?》针对 ChatGPT、Google Gemini、Gemini AI Overview (Google 搜寻的 AI 摘要)、Microsoft Copilot、Meta AI 及 Perplexity 等六个工具进行测试,每个 AI 会被询问包含个人理财、法律、健康与饮食、消费者权益及旅游等不同面向、共 40 个问题,再由专家确认准确度、清晰度、实用性、伦理责任等指标,进而给出整体评分,结果如下(分数越高越好):
2.Gemini AIO:70%
3.Gemini 69%
4.Copilot:68%
5.ChatGPT:64%
6.Meta AI:55%
调查发现,AI 给予的答案存在许多隐忧,例如许多来源引用 Reddit 论坛或未知网站,并非来自权威内容,甚至有的 AI 会提供错误的理财、医疗资讯。当旅游碰到意外时,它甚至可能误导取消机票可以全额退费,或是对于票务规则本身就有错误理解,在法律上的专业度也明显不足,没有提醒消费者应该征询专业的法律建议。
《Which?》科技专家 Andrew Laughlin 指出:“我们的研究发现,AI 有太多令人不安且不准确的误导性陈述,尤其是在碰到财务、法律谘询等重要议题时。”他警告用户,使用 AI 务必明确定义问题,并且仍要检查资讯来源,对于医疗、财务等复杂议题,一定要寻求专业谘询后,再做出重大决定。

(示意图)
| 当前新闻共有0条评论 | 分享到: |
|
||||||||||
| 评论前需要先 登录 或者 注册 哦 |
||||||||||||
| 24小时新闻排行榜 | 更多>> |
| 1 | 明明是世界领土大国,她偏要伪装成弹丸小国 |
| 2 | 爆北京拉响警报:2026头号风险浮出水面 |
| 3 | 北京七环隧道大爆炸传出惊人内幕 |
| 4 | 中国金融圈炸锅,投行“第一美女”栽了 |
| 5 | 消息:中共少校飞行员驾机自戕身亡 |
| 48小时新闻排行榜 | 更多>> |
| 1 | 波兰参战了 |
| 2 | 明明是世界领土大国,她偏要伪装成弹丸小国 |
| 3 | 要玩真的了!他点名警告习近平 |
| 4 | 万劫不复!中国正在重演晚清最后十年 |
| 5 | 会议内幕曝光!习等四人遭“围攻” |
| 6 | 更多人出事?北京流传神秘名单 |
| 7 | 爆北京拉响警报:2026头号风险浮出水面 |
| 8 | 北京大秀肌肉时刻,一张“致命照片”被公布 |
| 9 | 北京七环隧道大爆炸传出惊人内幕 |
| 10 | 中国金融圈炸锅,投行“第一美女”栽了 |
| 一周博客排行 | 更多>> |
| 一周博文回复排行榜 | 更多>> |
| 1 | 台湾问题:麻将停牌 | 随意生活 |
| 2 | 梅兰芳和兩位仍然在世的入室弟 | 玉质 |
| 3 | 川普到底卖了乌克兰没有? | 山蛟龙 |
| 4 | 第一美女:《越人歌》-宋祖英 | YOLO宥乐 |
| 5 | 做这道题,知道明年你要去哪? | 末班车 |
| 6 | 关于离岸爱国 | 阿里克斯Y |
| 7 | 海外中文出版的新路基本开通, | 高伐林 |
| 8 | 70%美国大学毕业生找不到工作 | 乐维 |
| 9 | 大湾区的整合梦 | 文庙 |
| 10 | 给菓趣的回复,你至少有放风的 | renweida |