万维读者网 > 信息时代 > 正文  

响应速度碾压英伟达 AI芯片又出“王炸”

www.creaders.net | 2024-02-21 18:10:09  红星新闻 | 0条评论 | 查看/发表评论

就在全世界还沉浸在Sora带来的视觉震撼时,AI圈又出了一个“王炸”产品,这一次是在芯片领域。

自从AI赛道大热以来,人们的关注点主要在各种大模型的竞争,OpenAI、谷歌、Meta等巨头和各种初创企业在软件层面“争奇斗艳”。而在硬件层面,似乎英伟达已经“一骑绝尘”,该公司生产的GPU芯片“一片难求”,全球AI厂商都争相求购。

不过就在当地时间20日,初创芯片企业Groq开放了免费试用,其芯片响应速度震撼了业界。搭载Groq芯片的大模型回复用户的速度极快,达到普通人打字速度的75倍,比英伟达芯片的响应速度快10倍以上。对于习惯了ChatGPT等AI产品“一个字一个字蹦出答案”的用户来说,如今看到AI模型生成文章的速度比“眨眼睛还快”,其震撼程度可想而知。

Groq芯片大获好评

响应速度比英伟达快十倍以上

Groq在20日宣布对AI云服务平台进行免费开放体验,该公司官方账号还在社媒发文,鼓励粉丝积极参与互动。这次Groq在服务器上运行了Meta公司开发的Llama二代大模型等产品,因为和ChatGPT等闭源产品不同,Llama等模型是开源产品,允许其他厂商使用。

很快,体验了“无卡顿”状态的用户们对Groq发出了惊叹和赞美,“刷屏”了整个AI圈。比如,一位市场营销行业的用户截屏说明了自己的体验:Groq云服务平台针对他提出的专业领域问题,仅用4秒钟就生成了上千个英文单词的回答,而且这一回答真实可信,并附有注释和资料来源。

还有人用实验证明,Groq云服务平台搭配Llama2-70B模型,可以在7分钟之内打出和莎士比亚名篇《哈姆雷特》同样多单词量的文章,这一速度至少是普通人打字速度的75倍。有业界人士评论称,Groq芯片在响应速度上完全秒杀英伟达,给那些“喜欢低延迟体验”的用户带来了极大的惊喜。

Groq官网鼓励用户体验“全球最快的大模型输出速度”

在此之前,用户们已经普遍习惯了由英伟达芯片驱动下的AI大模型十分缓慢的答复速度,“就像看着对面打字的人一个字一个字地往外蹦出答案”。而在Groq云服务平台,用户可谓“目不暇接”,AI生成答案的速度远远超过肉眼阅读的速度。

专业测评显示,Groq芯片搭配Llama二代模型可以达到每秒近500个token,如果搭配其他小厂商的模型甚至能达到每秒700token的文字处理速度。而根据公开数据测算,英伟达旗下芯片驱动的GPT大模型的文字生成速度大约为每秒40个token。

响应速度碾压英伟达    AI芯片又出“王炸”

技术路线不同形成速度优势

专家称不应过度拔高其表现

众所周知,英伟达已经成为AI时代全球最大的芯片赢家,凭借着极其强大的性能让各路AI厂商疯狂“抢货”。英伟达就像AI时代的“军火商”,旗下的芯片成为各路豪强争抢的先进武器。那么,为何Groq芯片的响应速度会远超英伟达呢?这里主要是因为Groq选择了完全不同的技术路线。

Groq公司官网介绍,该公司是全球范围内首个创造了LPU(语言处理单元)技术路线的芯片厂商,而英伟达采用的是主流的GPU(图形处理单元)路线。LPU架构是Groq公司专为AI推理所设计的,线路极其精简,也没有GPU需要的高性能且昂贵的内存结构。另外,通过LPU也在能效上更胜一筹,让芯片更“饱和”地进行计算,提高了处理效率。

正因如此,LPU在速度上“独领风骚”,但GPU在深度学习上还是没有竞争对手可以匹敌。目前Groq生产的LPU芯片还不能被用于训练大模型,只能用于AI推理(即使用训练好的AI大模型生产答案)。

响应速度碾压英伟达    AI芯片又出“王炸”

Groq官网称自家芯片(左)的设计效率远超竞争对手(右)

阿里前技术副总裁贾扬清点评道,虽然他本人非常欣赏Groq公司,但LPU芯片的成就不应该被过度拔高。他举例表示,Groq以极端方式追求处理速度而牺牲内存和并行运算能力,导致能由一块英伟达芯片处理的计算量理论上需要几百块Groq芯片组装到一起才能完成。这样虽然英伟达芯片的单价更为昂贵,但如果选择使用Groq芯片训练大模型,还要付出更多倍的代价。

Groq创始人兼CEO乔纳森·罗斯此前对媒体表示,在大模型推理场景下Groq芯片的速度比英伟达快10倍,但价格和耗电量都仅为后者的十分之一。这一点也被业内人士指出是“片面的宣传”。

芯片行业专家姚金鑫也以个人名义撰文表示,英伟达作为AI芯片领域绝对的领先者,人们期待出现挑战英伟达的对手,但对Groq芯片的表现不应过度拔高。姚金鑫称,“速度在这里成了Groq的双刃剑”,Groq的架构建立在小内存、大算力的基础上,因此有限的内容对应着极高的算力,导致其速度非常快。但是反过来说,Groq极高的速度是建立在很有限的吞吐能力上的,每张芯片能够处理的内容量太小。

创始人曾是谷歌工程师

豪言将把计算成本“降至零”

Groq公司总部坐落在美国加州山景城,这里也是谷歌等众多科技巨头的总部所在地,这也和创始人乔纳森的出身有关。

乔纳森曾经是谷歌工程师,在工作中他痛感传统的CPU和GPU等处理单元的表现存在很大“瓶颈”,芯片的运算能力并没有被发挥到极致。因此他选择了辞职创业,招募了很多硅谷巨头企业的工程师一起研究新的技术路线。乔纳森曾表示,Groq的公司使命必须是有颠覆性的,“我们致力于将计算的成本降至零,以此释放人工智能的所有潜力”。

运用自己强大的技术能力、人脉和管理经验,Groq被乔纳森经营得有声有色。2022年12月,Groq宣布获得由老虎环球基金领投的C轮融资,融资额度高达300亿美元,该公司也因强大的“吸金”能力让AI圈刮目相看。2023年8月,Groq宣布选择三星Foundry泰勒工厂为其生产4纳米制程的AI加速器芯片。这座工厂是三星在美国大手笔建造的标志性项目,Groq成为其第一家客户,也标志着三星正式加入AI赛道的战场。

而到了今天,Groq又以“10倍英伟达”的闪电速度再次刷屏出圈,这家规模很小的初创企业成为了AI行业格局中不可忽视的搅局者。乔纳森曾经总结过自己的经营哲学,“我喜欢小团队快速作战,就像出发狩猎大象的猎人只需要带很少的干粮就能活很久。一旦打下了大象,就可以够他吃很长时间了。”

   0


24小时新闻排行榜 更多>>
1 何时打台湾?传习军委会议说了8个字
2 玩弄北京于股掌 习近平首度破天荒教训金正
3 突发!直升机坠毁 国防司令等10名高级军官
4 凄惨!中共最担心的事儿发生了
5 惊传:中共三中全会要抓正国级政治骗子

48小时新闻排行榜 更多>>
1 余茂春惊人预告 习近平的噩梦要来了
2 突发:全球最大光刻机巨头爆雷 股价跳水
3 何时打台湾?传习军委会议说了8个字
4 玩弄北京于股掌 习近平首度破天荒教训金正
5 火箭军又将大地震?习四个字批示
6 突发!直升机坠毁 国防司令等10名高级军官
7 凄惨!中共最担心的事儿发生了
8 华尔街大鳄警告 它是一个“巨大的泡沫”
9 中国力推免签 2024第一季出入境人次破1
10 惊传:中共三中全会要抓正国级政治骗子
热门专题
1
以哈战争
6
中共两会
11
秦刚失踪
2
中美冷战
7
台湾大选
12
火箭军悬案
3
乌克兰战争
8
李克强猝逝
13
台海风云
4
万维专栏
9
中国爆雷
14
战狼外交
5
美国大选
10
李尚福出事
15
普里戈津
一周博客排行 更多>>
1 习近平一盘神秘大棋成就了大日 文庙
2 周傥:美国迫在眉睫的危险 万维网友来
3 速战速决 伊朗真乃大丈夫也 体育老师
4 达唐:故宫博物院遭公开举报 万维网友来
5 谁是中国人? 谢盛友文集
6 现代战争目的:摧毁战争意志 施化
7 日本电影《追捕》中的杜丘和真 弓长贝占郎
8 辛峰:特鲁多为什么不信加拿大 万维网友来
9 川普就是美国的毛泽东 右撇子
10 我宁在纽约行乞,也不在上海做 恨中
一周博文回复排行榜 更多>>
1 川普就是美国的毛泽东 右撇子
2 警惕有人把民主党与共和党的关 karkar
3 美国为何选择这个时候公布中共 山蛟龙
4 周傥:美国迫在眉睫的危险 万维网友来
5 现代战争目的:摧毁战争意志 施化
6 乌克兰呀,你太让人失望了! 山蛟龙
7 谁敢买中共国的电动车? 山蛟龙
8 习近平一盘神秘大棋成就了大日 文庙
9 去......化 山蛟龙
10 暴力,自由的唯一杀手 施化
关于本站 | 广告服务 | 联系我们 | 招聘信息 | 网站导航 | 隐私保护
Copyright (C) 1998-2024. CyberMedia Network/Creaders.NET. All Rights Reserved.