$北京君正(SZ300223)$ $兆易创新(SH603986)$ 马斯克最近 “火力全开”,在各种场合宣称,北京时间本周二中午,其旗下的 xAI 公司将重磅推出 Grok 3。他信誓旦旦地表示,Grok 3 将会是全世界最聪明的大模型,吊打DeepSeek 远远地甩在身后。要知道,Grok 3 的硬件配置堪称 “豪华”,背后有 Colossus 超算集群的强力支持,配备了 10 万块 NVIDIA H100 GPU,预训练算力达到了 Grok 2 的 10 倍之多。DogeDesigner 也对其赞不绝口,称它将是 “世界上最强大的 AI”。可以说,Grok 3 就是英伟达凭借强大算力创造奇迹的典型代表。也正因如此,今天周一的时候,所有和英伟达相关的公司股价又开始反弹了。 $寒武纪-U(SH688256)$

近日,AI芯片创新企业Groq(并非马斯克的Gork)提供了其产品的免费试用机会,不过呢,有另外一家去年大火的有意思的公司,名字和grok很像叫做Groq。其实一开始马斯克想给自己ai起名叫groq,可惜被注册了,最后叫Grok,当时Groq的创始人还和他有过争执,认为马斯克蹭他热度。

不过现在好了,伴随着Grok3即将面世,Groq也在华尔街被反向带起了热度。2 月 11 日消息,AI 推理芯片初创公司 Groq 当地时间昨日宣布,沙特阿拉伯承诺向其投资 15 亿美元。与市面上的其他AI聊天机器人相比,Groq凭借其惊人的响应速度脱颖而出。其大模型每秒能输出高达750个tokens,这比GPT-5快了整整18倍,而自研LPU的推理速度更是英伟达GPU的10倍。这一卓越性能让网友们惊叹不已,纷纷表示“大模型最快推理芯片的桂冠易主,英伟达不再是独占鳌头”。

Groq,这家成立于2016年的人工智能解决方案公司,其名字与马斯克的大模型Grok读音相近,近期备受瞩目。其突出的亮点在于卓越的处理速度。据媒体披露,Groq的芯片推理速度相较于英伟达GPU提升了高达10倍,同时成本仅为后者的1/10。在运行大模型时,Groq的生成速度可接近每秒500个tokens,这一速度远超ChatGPT-5的约40 tokens/秒。更为惊人的是,在极限情况下,其Llama2 7B模型甚至能达到每秒750个tokens,这几乎是GPT-5的18倍。

在Groq的创始团队中,有8位成员曾是谷歌早期TPU核心设计团队的成员。然而,Groq并未选择采用TPU、GPU或CPU等现有技术路线,而是创新性地自研了名为LPU的语言处理单元。据Groq官网介绍,其LPU推理引擎在运行Meta AI的Llama 2 70B模型时,性能表现优于所有其他基于云的推理提供商,吞吐量更是提升了高达18倍。

然而,尽管Groq在速度上取得了显著优势,但AI的发展并不仅仅取决于速度。在Groq受到广泛关注的同时,也出现了一些不同的声音。有网友指出,Groq LPU卡的内存仅为230MB,售价却高达2万多美元,这似乎并不符合成本效益的原则。与英伟达的H100相比,Groq的性价比显然较低。

最近,Groq 发布的演示视频犹如一颗重磅炸弹,在网络上迅速掀起了一阵热潮。视频中其展现出的速度令人惊叹,让 ChatGPT、Gemini 以及 Grok 等现有的聊天机器人都显得有些逊色。

Groq 一直颇为自豪地宣称自己拥有 “世界上最快的大型语言模型”,而第三方测试的结果也似乎证实了这一点。在 X 平台展示的一个演示视频里,Groq 仅仅在一瞬间就给出了包含数百个单词的事实性回答,并且还附上了引用来源,这般表现着实令人惊叹不已。在另一个演示中,Groq 的创始人兼 CEO Jonathon Ross 安排了一场别开生面的实时对话:一位 CNN 主持人与远在另一端的 AI 聊天机器人进行了实时口语交流,这一操作充分展现了 Groq 技术强大的实时交互性。

不可否认,其他聊天机器人的表现也相当不错,但 Groq 凭借着速度上的绝对优势,在实际应用中脱颖而出,更胜一筹。而这背后的关键,得益于 Groq 创新的核心技术 —— 语言处理单元(LPUs)。据了解,这种 AI 芯片的运行速度甚至超越了长期以来被视为 AI 模型运行行业标准的 Nvidia 图形处理单元(GPUs)。从早期的测试结果来看,LPUs 的性能确实很有可能远超 GPUs。

Groq 不仅仅是一个普通的 “推理引擎”,它更像是聊天机器人的速度助推器。虽然它不会完全替代现有的聊天机器人,但却能极大地提升它们的运行效率。根据上月 Artificial Analysis 发布的第三方测试报告,Groq 的产出速度达到了惊人的每秒 247 个标记,相比之下,微软仅有每秒 18 个标记。这一数据意味着,如果 ChatGPT 等聊天机器人采用了 Groq 的芯片,其运行速度有望提升 13 倍以上,实现真正意义上的速度大变革。

在当今的 AI 领域,像 deepseek、ChatGPT、Gemini 和 Grok 这样的 AI 聊天机器人已逐渐走入人们的日常生活。然而,它们在实时对话中存在的延迟问题,极大地影响了用户体验。倘若这些模型能够拥有更快的运行速度,其在日常应用中的实用性必将得到显著提升。

幸运的是,Groq 公司推出的 AI 芯片技术 —— 语言处理单元(LPUs),为解决这一难题带来了新的希望。LPUs 的运行速度超越了 Nvidia 的图形处理单元(GPUs),可以说是为 AI 领域带来了一场革命性的变革。Groq 的创始人兼 CEO Jonathon Ross,曾是谷歌 AI 芯片部门的共同创立者,对 AI 芯片技术有着深刻的理解。据他介绍,通过 LPUs,Groq 成功突破了 GPUs 和 CPUs 在计算密度和内存带宽方面的限制,大幅提升了大型语言模型(LLM)的运行速度。

关于 LPU 芯片,我们不妨听听 deepseek 的解读。用通俗的话来讲,LPU 就像是专为语言处理精心设计的跑车,而 SRAM 则如同它强劲的高速引擎。由此可见,在投资 LPU 产业链时,SRAM 供应商是值得重点关注的对象。

进一步来说,LPU 芯片与 SRAM 之间的关系,恰似 “跑车与发动机”。LPU 作为专为语言处理打造的 “跑车”,SRAM 则是赋予其速度的 “高速发动机”。具体表现为:

LPU 依赖 SRAM 实现速度飞跃:LPU 芯片专为 AI 推理而设计,比如能让 ChatGPT 迅速回答用户的问题。SRAM 是一种速度极快但成本较高的内存。与传统 GPU 使用的 HBM 内存(好比一个容量巨大但取货速度较慢的大仓库)不同,LPU 采用了 SRAM(类似便捷的快递柜,虽然容量相对较小,但取货速度极快)。SRAM 的读写速度比 HBM 快约 20 倍,这使得 LPU 在处理语言任务时不仅速度更快,而且更加省电。

为何 LPU 概念股多为 SRAM 公司:SRAM 是 LPU 的核心组件:就如同电动车离不开电池一样,LPU 的性能直接受制于 SRAM。像北京君正、兆易创新等生产 SRAM 的公司,处于 LPU 产业链的上游,是至关重要的供应商。技术门槛高,先发优势明显:SRAM 技术成熟且难以被轻易替代,这些掌握相关技术的公司拥有明显的先发优势。例如,北京君正在全球市场占据着较高的份额,恒烁股份则专注于研发存算一体芯片。市场需求激增:随着 LPU 在 AI 推理领域的广泛应用,SRAM 的需求呈现出爆发式增长。以运行一个 70B 参数的大模型为例,需要将数百个 LPU 芯片并联使用,而每个芯片都离不开 SRAM 的支持。

简单总结,LPU 正是依靠 SRAM 实现了速度上的大幅提升。因此,在投资 LPU 产业链时,SRAM 厂商就如同 “卖铲子的人”,至关重要。

在推理时代的大背景下,无论训练算力多么强大,未来的竞争主战场无疑将聚焦于推理算力。即使是未来的 Grok3,也有可能借助 Groq 的 LPU 芯片来提升运行速度。而 deepseek 与 Groq 若能实现强强联合,其威力究竟如何,是否能够撼动英伟达的地位,着实令人期待。

事实上,自从 deepseek 崭露头角以来,AI 领域的各大公司纷纷亮出自己的杀手锏。因为这场争夺王者之位的较量或许已经进入了收官阶段。可以预见,未来的 AI 行业将会日新月异,每天都可能出现重大的变化,令人应接不暇。也许前一天还风光无限的技术或产品,第二天就会被新的成果超越,落后于时代的步伐。

以下AI 不做投资建议

LPU 概念股众多,涵盖芯片设计、存储芯片、封装测试等多个产业链环节,以下是一些主要的 LPU 概念股:

芯片设计类

寒武纪(688256):AI 芯片龙头,思元系列专攻推理场景,与 LPU 技术路线高度同步,可用于 LPU 的推理加速。

云天励飞(688343):边缘 AI 芯片企业,ASIP 架构适配 LPU 边缘推理需求。

海光信息(688041):国产 AI 芯片龙头,产品适配 LPU 相关人工智能应用。

龙芯中科(688047):国产 CPU 领军企业,适配 LPU 边缘计算场景。

澜起科技(688008):AI 芯片设计企业,其 AI 芯片可使 LPU 方案能效比提升 40%。

存储芯片类

北京君正(300223):全球 SRAM 龙头,为 LPU 提供核心存储支持,旗下 ISSI 为 LPU 提供关键的高带宽、低延迟 SRAM 存储。

兆易创新(603986):存储芯片领军者,覆盖多种 SRAM 芯片类型,可满足 LPU 所需的多种容量和接口类型的 SRAM 芯片需求。

恒烁股份(688416):专注 SRAM 存储芯片,研发基于 SRAM 的存算一体 AI 推理芯片,与 LPU 技术契合。

东芯股份(688110):NAND Flash 存储方案提供商,适配 LPU 边缘计算。

封装测试类

长电科技(600584):全球封测龙头,为 LPU 芯片提供先进封装测试服务,在 LPU 封装市占率超 30%。

通富微电(002156):AMD 封测供应商,LPU 订单快速增长,可能参与 LPU 芯片的封装测试。

华天科技(002185):存储芯片封装专家,服务于 LPU 芯片环节。

系统集成与配套

中科创达(300496):智能操作系统龙头,适配 20 余种 LPU 架构。

芯朋微(688508):电源管理芯片企业,能效提升至 92%,为 LPU 芯片提供电源管理支持。

广和通(300638):5G 通信模块龙头,时延低至 3ms,为 LPU 提供高速通信连接。

其他相关领域

中兴通讯(000063):自研定海 1.0 芯片,提供低时延解决方案,与 LPU 技术相关。

博创科技(300548):光模块企业,与 LPU 互联技术相关。

景嘉微(300474):GPU 芯片企业,其产品在图形处理和 AI 推理方面与 LPU 有协同作用。