万维读者网 > 信息时代 > 正文  

AI时代的稀缺资源“媒体报道”

www.creaders.net | 2025-02-07 19:26:19  朝鲜日报 | 0条评论 | 查看/发表评论

韩国国内一位房地产专家向中国人工智能(AI)DeepSeek提问说:“O O(自己的笔名)是谁?”结果让他大为吃惊。他的主要活动和主张被一目了然地列举了出来,甚至说明了他为什么著名。信息的质量和深度超过了OpenAI的ChatGPT。DeepSeek怎么会知道这些信息?OpenAI质疑DeepSeek偷走了其数据,但可能不止这些。

▶美国大科技公司在编写ChatGPT等AI模型时收集了世界上所有的信息,其核心是媒体积累了100多年的新闻报道。大科技公司对AI开发过程中收集数据最多的前10个网站进行了调查,其中5个是新闻社。在前100个网站中,媒体占据了51个。《纽约时报》知道AI免费盗取记者们用血汗制作的报道的事实后,以OpenAI为对象提起了侵犯著作权的诉讼,媒体开始限制免费使用数据。

▶OpenAI与美联社、《华尔街日报》等部分媒体签订了单独的合同,缴纳数据使用费,但很难向全世界媒体缴纳使用费。主要网站也开始对收集数据的AI机器人下达“禁止出入令”。新的数据收集变得困难后,埃隆·马斯克说:“训练AI所需的数据池正在枯竭。”相反,中国的新生AI对数据收集没有任何障碍和制约。DeepSeek和ChatGPT对韩国房地产专家的AI信息能力的差异可能是出于这个原因。

▶大科技公司们希望在AI人为制造的“合成数据”中找到突破口。以特斯拉为例,它已经用完了全球的交通事故信息,不再有新数据,而是将“深夜在国道行驶时,在交加雷电的暴雨中,野猪冲进道路的情况”制作成合成数据,将其放入算法中。但如果加入大量合成数据,此前的错误和幻觉现象就会积累起来,导致AI模型的质量下降。

▶想打造更聪明的AI,优质的数据是不可或缺的。比起在社交媒体(SNS)上流传的假新闻、粗鲁的措辞,经过事实确认后使用精炼措辞的媒体新闻是“高品质的稀缺资源”。这也是为什么大科技企业不得不追求与新闻社共赢模式的原因。中国是一个根本没有言论自由的国家。在没有自由和高质量媒体的国家,很难出现世界顶级的AI模型。

   0


24小时新闻排行榜 更多>>
1 传习又犯病 李强话风也变了
2 中国又1顶尖人才身亡 才48岁 网疑被暗杀
3 中共前高官落马大快人心 民间拉横幅放烟花
4 大反转!中南海噩梦开始…
5 太低估他了,川普看错一件事
热门专题
1
AI
6
万维专栏
11
以哈战争
2
川普
7
洛杉矶大火
12
巴黎奥运
3
俄乌战争
8
叙利亚
13
三中全会
4
大S
9
苗华被抓
14
中共两会
5
中美冷战
10
美国大选
15
台湾大选
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2025. Creaders.NET. All Rights Reserved.