深度 | 啥是大模型？一篇文章看懂火遍全网的“AI大模型”

导语：

美国商业科技界正在升起两位“新神”。

一位是“钢铁侠”埃隆·马斯克，“带领人类走向火星”；

一位是“奥特曼”山姆·阿尔特曼，“带领AI走向人类”。

大多数人对马斯克很熟悉了，特斯拉汽车在中国道路上疾驰，朋友圈也经常能刷到SpaceX火箭发射和星链卫星的新闻。

阿尔特曼是因为ChatGPT爆热，才被国人知晓。2023年，大模型LLM、AGI、AIGC、Prompt成为很多人口中的新名词。

本文就从头开始聊一聊：啥是大模型？

正文内容包括：

1）啥是大模型？ChatGPT掀起了第四次AI浪潮

2）百模大战：最值得关注的“100家AI大模型”

3）中美争锋：“中国BAT” 大战 “美国OMG”

啥是大模型？

百度李彦宏近期经常在演讲中谈及大模型，用的标题都很吸睛 ——《大模型改变世界》。

“人工智能再次成为人类创新的焦点，越来越多的人认可第四次产业革命正在到来，而这次革命是以人工智能为标志的。

之所以成为焦点，是因为大模型。大模型成功地压缩了人类对于整个世界的认知，让我们看到了实现通用人工智能的路径。

当下，我们正处在全新起点，这是一个以大模型为核心的人工智能新时代，大模型改变了人工智能，大模型即将改变世界。”

360周鸿祎也不止一次地提到，过去三个月，相当于过去人工智能历史上的三十年，大模型是新时代“发电厂”。

“我觉得大模型的机会是一次不亚于PC、互联网、iPhone被发明的机会，应该说是一次新的工业革命的机会。

现在数字化已经成为国家战略，但数字化的终点不是大数据，数字化的终点应该是智能化。”

李开复博士更是在《AI1.0到AI2.0的新机遇》的演讲中，旗帜鲜明的发声：AI大模型是不能错过的历史机遇！AI2.0市场预计将是移动互联网规模的10倍。

无论是企业还是个人，都极度重视这一波AI大模型巨变。

但是，究竟啥是大模型？

百度百科给了一个“很糟糕的”回答：为了仿照实体而去建造的大型道具模型。

文心一言回答地还不错：

AI大模型是人工智能领域中的一种重要技术，具有强大的能力和广泛的应用前景。

今年4月，我现场参加了陆奇博士的分享，第一次比较清晰地理解了这个所谓的“大模型”。

陆奇博士放了一张PPT：

无论是人类还是机器，都是这三个体系的组合：

“信息”系统（subsystem of information），从环境当中获得信息；

“模型”系统（subsystem of model），对信息做一种表达，进行推理和规划；

“行动”系统（subsystem of action），我们最终和环境做交互，达到人类想达到的目的。

基于此，陆奇还得出一个简单结论。

今天大部分数字化产品和公司，包括Google、微软、阿里、字节，本质是信息搬运公司。

“一定要记住，我们所做的一切，一切的一切，包括在座的大部分企业都在搬运信息。Nothing more than that，You just move bytes。但它已经足够好，改变了世界。”

可以说，以前的PC互联网也好，移动互联网也好，都还是信息无处不在。

2023年的拐点是什么？

AI大模型。

当下，模型无处不在，未来，行动无处不在。

陆奇的布道，让众多创业者和投资人，清晰地感受到了，无处不在无所不能的“大模型”。

今年6月，在黑马AIGC产业营上，百度智能云李扬，从人工智能的技术维度，更仔细地说清楚了——啥是大模型？

人工智能＞机器学习＞深度学习＞深度学习模型＞预训练模型＞预训练大模型＞预训练大语言模型

预训练大预言模型的代表：就有百度的文心、Open AI的GPT，进而有了文心一言和ChatGPT等大模型产品。

回头看一下，ChatGPT的英文全称：Chat Generative Pre-trained Transformer，恍然大悟。

这时如果再有人问你“啥是大模型”，你是不是，从概念到技术，都比较清晰了。

还没完，我们还应该从产业的视角进一步来看，什么是大模型？什么是AIGC应用？什么是算法、算力和数据？什么是模型层、应用层？

可以看一下上帝视角般的——“产业图谱”。

众所周知，AI人工智能，早已不是什么新鲜词了。

你的脑中或许会闪过这样的几个重要节点：

Deep-blue（1997）- AIphaGo（2016）- ChatGPT（2023）

人工智能的浪潮可谓是一波又一波。

人们回过头看，2014年之后的那一波AI创业企业，在近两年也是陷入低谷。

曾经的AI四小龙，而今安在哉？

语言人工智能、视觉人工智能、安防人工智能，也都时过境迁，远远不如今天的大模型、AGI、AIGC、ChatGPT火热。

给大家梳理下四个名词概念：AI、AGI、AIGC、ChatGPT。

AI：人工智能（Artificial Intelligence），英文缩写为AI。它是研究、开发用于模拟、延伸和扩展人的智能的理论、方法、技术及应用系统的一门新的技术科学。

AGI：通用人工智能（Artificial general intelligence），计算机科学与技术专业用语。这一领域主要专注于研制像人一样思考、像人一样从事多种用途的机器。这一单词源于AI，但是由于主流AI研究逐渐走向某一领域的智能化（如机器视觉、语音输入等），因此为了与它们相区分，增加了general。

AIGC：人工智能生成内容（AI generated content），又称生成式AI。例如AI文本续写，文字转图像的AI图、AI主持人等，都属于AIGC的应用。

ChatGPT:（ChatGenerative Pre-trained Transformer），美国OpenAI 研发的聊天机器人程序，于2022年11月30日发布。ChatGPT是人工智能技术驱动的自然语言处理工具，它能够通过理解和学习人类的语言来进行对话，还能根据聊天的上下文进行互动，真正像人类一样来聊天交流，甚至能完成撰写邮件、视频脚本、文案、翻译、代码，写论文等任务。

所以，当智源研究院林咏华在黑马AIGC产业峰会上说：

“AIGC+ChatGPT大模型正是第三次浪潮谷底之后迎来的拐点，也是由大模型推动的新的一轮发展浪潮的来临。”

台下的我，是极度认同的。

光有技术和产品还不够，还得有顾客用户愿意买单。

商业化的考卷难题，再一次传到AI大模型企业的手中……

百模大战：最值得关注的100家AI大模型

有了产品就有了市场，有了江湖就有了竞争。

移动互联网时代的那场“百团大战”，还让很多从业者记忆犹新。

那会，无论是马云、马化腾还是李彦宏，整个互联网圈都还在喊：

“所有行业都值得用互联网重做一遍。”

再看如今，无论是阿里百度，还是腾讯华为，也都在新时代振臂高呼：

“所有行业都值得用大模型重做一遍。”

故事总是充满熟悉的味道。

2023年，“百模大战”，一触即发。

因为工作需要，我除了参加行业、企业、研究机构的发布会和闭门会，还需要基于自身的业务，不断了解最新的AI大模型和AIGC应用。

比如，我们有产业媒体，从而需要了解各个企业的大模型和AIGC产品动态；比如，我们有商业培训，从而需要挖掘行业里的导师资源和学员需求；我们自己的技术团队也开发了行业大模型，从而也需要了解产业上下游有没有合适的合作伙伴。

基于这个公众号以及网站，我们的AI黑马媒体栏目，就是要聚焦AI大模型和AIGC产业，提供深度内容和榜赛会课，和从业者一起奔赴AI新时代。

我们整理了《百模大战：最值得关注的100家AI大模型》，从这100个AI明星企业，足以窥见未来伟大的新世界！

《百模大战：最值得关注的100家AI大模型》

（本版顺序随机排布，未来将发布权威榜单）

创业黑马牛文文曾在演讲中提到，只要有一个革命性技术出来，中国在应用层会快速追上。

“在AI大模型和AIGC应用上，互联网大厂、高校和研究机构、产业龙头企业，包括一些先知先觉的中小企业，都可以再大模型领域和大模型时代有所作为。”

那么，中国进入“百模大战”，未来机会在哪？

或者说，除了诞生ToC的“中国版ChatGPT”，中国的通用大模型企业其它的机会点在哪？

第一，ToG政府，为各级政府各个城市部署私有化大模型。

第二，ToB企业，为一些有需求的企业部署私有化大模型。

除了通用大模型，未来也将属于千千万万的行业大模型。

这主要是因为，越来越多的人感受到通用大模型的问题：

比如，大模型是“通才”，但缺乏行业深度。比如，大模型无法保证内容可信，行业称之为“幻觉”。还有一个很现实的问题，共有大模型的训练和部署成本太高，大多数中小企业无法承担，进而导致无法普惠到所有人。

相较于通用大模型，行业模型至少有三个优点：

第一，解决专业领域问题能力很强；第二，训练和部署成本更低；第三，升级和迭代更加灵活。

或许，AI大模型的未来，将是十几个通用大模型，以及成百上千个行业大模型。

除此以外，基于大模型产生的AIGC应用更是数不胜数，遍布各个细分场景，帮助人们解决各个具体问题。

中美争锋：“中国BAT”大战“美国OMG”

不止百模大战，也是中美争锋。

早在2017年，国家就出台了新一代人工智能发展规划，明确将人工智能列为国家战略。今年4月28号，中央政治局会议更是重点提及要重视通用人工智能的发展，营造创新生态。7月13日，《生成式人工智能服务管理暂行办法》公布，鼓励技术在各行业和各领域的创新应用。

人工智能三大要素，算力、算法和数据。其中，中国两国在算力方面差距不大，按2022年年底的数据，美国占全球算力36%，中国占31%。

不可否认的是，中美在AGI和AIGC上还是存在差距的。

大模型的基础是深度学习框架，美国的Tensorflow和PyTorch已经深耕深度学习框架生态多年，虽然国内企业也自主开发了深度学习框架，但市场考验还不够，生态还有待打造。

邬贺铨院士认为：“在中国从事AI研究的技术人员不算少，但具有架构设计能力和AIGC数据训练提示师水平的人才仍然短缺。在ChatGPT出现之前，有人认为中国在AI方面的论文与专利数与美国不相上下，ChatGPT的上线使我们看到了在AIGC上中美的差距，现在是需要清楚认识和重视我们面对的挑战，做实实在在的创新。”

现在许多公司和研究机构都处在“百模大战”之中，不论初创公司还是大公司，充分竞争的市场才是好市场，充分竞争的公司才是好公司。

张亚勤院士认为：“大模型时代才刚刚开始，42公里的马拉松我们刚跑到5公里，算力、数据不够都不成问题。中国在PC时代落后于美国，但在移动互联时代领先于美国（数字支付、微信、短视频），AI时代要给创业者、科研人员、企业更多信心。”

一些产业从业人士指出，在AI大模型上中美争锋，主要是“OMG”和“BAT”的战斗。

我们依次看一下这六家企业：OpenAI、Meta、Google、百度、阿里、腾讯。

1）Open AI

2022年11月30日，OpenAI发布ChatGPT。作为ChatGPT的母公司，Open AI引领着AI大模型的发展。2016年微软投资了OpenAI十亿美金。2020年推出的 GPT-3 ，有1750亿参数，是大模型的技术。2022年推出的 ChatGPT 是基于大模型的产品形态。2023年微软继续投入100亿美金，OpenAI+微软已成为最具影响力的AI力量。

2）Meta

Facebook先是押注元宇宙，如今又入局AI大模型。扎克伯格是蹭热点，还是全面发力?过去Facebook的使命是“Make the world more open and connected”，这个话也是非常具有互联网时代特色的，就是开放、连接。如今，扎克伯格已然意识到这个东西不够了，他说我们要“Bring the world closer together”，怎么才能“closer together”呢？还是要通过用户画像、通过人工智能的技术，找到人和人之间相同的兴趣，把他们连接在一起。MetaAI发布了开源大模型LLaMA，可以在单个GPU上运行。

3）Google

2023年5月10日，谷歌在两个小时的大会里提及“AI”200多次，并一口气推出了AI大模型PaLM2、AI机器人Bard、AI搜索、AI办公等多款模型和产品，一套完整的AI系统全面嵌入谷歌旗下超过25个产品和应用。

4）百度

2023年3月16日，百度在中国率先发布文心大模型。据了解，百度是中国最早布局大模型的公司，于2019年就开始了预训练模型 Ernie1.0。目前，文心大模型家族已形成文心大模型+工具与平台+产品与社区的庞大大家族。

除了依托百度搜索的海量数据优势，百度在AI大模型领域的“四层模式”（芯片层+框架层+模型层+应用层）才是其在“百模大战”中的核心竞争力。百度之所以能够在Google、Meta、阿里、腾讯等大厂之前先做出来“文心一言”，就是因为这四层的全栈布局。

百度在芯片层的布局是昆仑芯，已经量产几万片。昆仑芯第三代，预计2024年初量产。飞桨属于框架层，文心属于模型层。

5）阿里

2023年，4月11日，阿里发布大模型。张勇表示，阿里巴巴所有产品未来将接入“通义千问”大模型，进行全面改造，包括天猫、钉钉、高德地图、淘宝、优酷、盒马、饿了么等。他认为，面向AI时代，所有产品都值得用大模型重新升级。

阿里云也面向企业提供普惠的AI基础设施和大模型能力。未来每一个企业都可以通过阿里云调用通义千问的全部能力，也可以结合企业自己的行业知识和应用场景，训练自己的企业大模型。比如，每个企业都可以有自己的智能客服、智能导购、智能语音助手、文案助手、AI设计师、自动驾驶模型等。

6）腾讯

直到2023年6月19日，腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展，宣布将助力企业构建专属大模型及智能应用，为企业提供MaaS一站式服务。

据了解，腾讯将为文旅、政务、金融等10余个行业，提供超过50个大模型行业解决方案。比如，基于腾讯云智能媒体AI中台，为央视打造人工智能开放平台，提供智能标签、修复、智能翻译等30多种算法。为上海大学，利用腾讯云教育行业大模型能力，构建专属的教育行业大模型基础平台，覆盖在校生和毕业生全生命周期业务，将提供教学助手、人才培养、招生就业助手和作业批改等服务；此外，腾讯企点、腾讯会议、AI代码助手等多款头部SaaS产品，也迎来了能力升级。

我们认为，中国大模型战队中除了BAT，还应该重点关注四家企业和机构，360、华为、智源和智谱。

百度、阿里、腾讯、360、华为、智源、智谱，就好比是中国AI大模型的“战国七雄”。

7）360

2023年6月13日，360集团对外发布了360智脑大模型。360关于大模型的战略是八个字：“两翼齐飞、四路并发”。

“两翼齐飞”，一方面要发展大模型的技术，另一方面要场景化、产品化、平民化、垂直化。只是模仿ChatGPT，做了一个搜索对话框，做了一个聊天机器人，指望这个东西带来工业革命是不现实的。场景分为四路：一是To C的场景，搜索引擎+浏览器和桌面。二是面向中小企业。三是面向政府、大型企业。四是面向行业的GPT，跟有行业数据的合作伙伴相结合。

8）华为

2023年7月7日，华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“AI for Industries ”华为的盘古大模型聚焦行业价值场景，围绕行业重塑、技术扎根、开放同飞三大方向，为行业客户提供服务。

盘古大模型3.0是一个完全面向行业的大模型系列，包括5+N+X三层架构。

华为从2019年到2021年之间就开始立项做盘古大模型。2021年发布了盘古NLP大模型、盘古机器视觉大模型、盘古科学计算大模型、盘古药物分子大模型。到2022年在行业中拓展应用，发布了盘古矿山大模型、盘古气象大模型、盘古海浪大模型、盘古金融OCR大模型。2023年7月7日发布的盘古大模型3.0，重点提及了5个基础大模型（自然语言、多模态、视觉、预测、科学计算）和7个行业大模型（政务、金融、制造、药物分子、矿山、铁路、气象）。

9）智源

2023年6月9日，智源研究院院发布了全面开源的“悟道3.0”系列大模型及算法。继 2021 年悟道大模型项目（悟道1.0于2021年3月发布）连创“中国首个+世界最大”纪录之后，智源 “悟道3.0 ”进入全面开源新阶段，带来一系列领先成果：“悟道·天鹰”（Aquila）语言大模型系列、天秤（FlagEval）开源大模型评测体系与开放平台，“悟道 · 视界”视觉大模型系列，以及一系列多模态模型成果。

10）智谱

2023年3月，基于千亿基座模型的ChatGLM开启内测。智谱AI由清华大学计算机系的技术成果转化而来，致力于打造新一代认知智能通用模型，提出了Model as a Service（MaaS）的市场理念。公司于2021年合作研发了双语千亿级超大规模预训练模型GLM-130B，并主导构建了高精度通用知识图谱，把两者有机融合为数据与知识双轮驱动的认知引擎，并基于此千亿基座模型打造ChatGLM。此外，智谱AI也推出了认知大模型平台Bigmodel.ai，形成AIGC产品矩阵。通过认知大模型链接物理世界的亿级用户、赋能元宇宙数字人、成为具身机器人的基座，赋予机器像人一样“思考”的能力。

最后，总结一下。

1、中国为什么一定要自研AI大模型？

基于战略安全角度和经济商业价值，都能得出中国一定要自研AI大模型这一确切答案。从中美贸易战到芯片卡脖子等，中国政府必然要保证关键技术的自主可控和国家安全。并且OpenAI和微软的实践也表明了，AI大模型将有巨大的商业价值，中国企业需要抓住这一机遇。

李开复也认为，“使用海外的开源大模型就可以做出中国版的OpenAI”的说法是绝对错误的，技术的天花板将决定你永远做不出达到或超越GPT-4.0技术水平的大模型。此外，拿海外训练出来的大模型，在国内做微调是值得商榷的。因为国内外的文化习惯、法律法规不同，所以自主创新做大模型是中国企业的必经之路。

2、中国AI大模型产品何时能赶上“ChatGPT”?

李彦宏曾公开表示，文心一言与ChatGPT版本差距并不明显，可能只相差一两个月的时间。对于这种说法，王小川则调侃称，媒体采访的可能是平行世界的李彦宏。

王小川认为国内目前的大模型和ChatGPT的差距不可能只是两个月。“如果在追上目前ChatGPT-3.5的水平，大概今年内就能做到，但如果要追上未来的GPT-4和GPT-5，预计要3年左右的时间。”

艾瑞咨询认为，与ChatGPT功能对标的大语言模型(Large Language Models, LLMs)，目前国外主要有Google推出的Gopher、LaMDA以及Meta的Llama等；国内为百度首发的“文心一言”、360发布的大语言模型、阿里发布的“通义千问”、商汤发布的 “商量”等。虽从对话和文本生成的直观体验看ChatGPT略胜一筹，但对于Google等国外大厂而言，克隆ChatGPT并不存在太高壁垒，当前暂时落后主要是出于公司战略与技术理念差异，选择了不同技术路线，随着各家探索成果和新技术方法的实践不断推进，仍存在对GPT系列模型赶超的可能。对百度等国内大厂而言，则在数据、算力、工程化能力等关键要素上存在短板，短期内难以对国外领先大模型实现赶超，为跟随者角色，长期更需要国内AI全产业链整体进化。

3、AI大模型的竞争关键和创新机会在哪？

1）通过OMG可以看到：ChatGPT在逻辑推理、上下文理解等方面的能力，是模型参数量达到该量级后“涌现”出的，即所谓的“大力出奇迹”。在此之前，坚定的科研初心，丰厚的资本支持，是中国科技企业需要向美国科技企业认真学习的。

2）通过百度可以看到：“基础层+模型层+应用层”，底层技术的积累至关重要。无论是芯片层的昆仑还是框架层的飞桨，“根技术”的深厚决定枝叶的生长速度。

3）通过阿里可以看到：“互联网时代的产品都值得用AI重新升级”。阿里是这么说的，也是这么做的。必然有后浪高举AI原生的旗帜，颠覆马云的互联网思维。

4）通过腾讯和华为可以看到。无论是云服务还是大模型，竞争的核心和商业的重点，都指向行业ToB服务，AI大模型要更有行业价值，也要“离钱更近一点”。

5）通过360可以看到，数字人是大模型重要的应用入口，大模型的发展要和国家的产业数字化战略相结合，企业级垂直大模型更为关键。把大模型拉下神坛，变成每个企业、政府部门都感觉能够直接使用的东西。

4、中小企业该如何面对AI大模型？

李开复说：

我们完全可以想象今天的Word、PowerPoint、Excel、Photoshop等应用通通都会用AI大模型重写一次，而且重写之后它的用户体验会变，甚至商业模式也会变。

李彦宏说：

业界有一种说法，大模型时代来了，每一个产品都值得重做一遍。但谁真正重新做了一遍呢？百度要做第一个把全部产品重做一遍的公司，不是整合，不是接入，是重做，重构！

也有企业保持理性：

折腾是找死！不折腾是等死！

大模型更像是巨头的游戏和军备竞赛，它和芯片、语料息息相关，如果没有巨量的资金储备，很难真正做大模型；非巨头还是要理性看待大模型。

大模型是基础建设，行业模型与应用场景等将拥有更大的发展机会？

创业黑马近期举办了两期AIGC产业营，参与者大多都是中小企业，300家。

通过其数据可以发现：25%的企业已经开始探索和应用AIGC，传统产业的企业期望利用AIGC转型升级，300家企业分布在企服、消费、培训、文娱、营销等各个行业领域。

但无论如何，中小企业不得不去思考：

有没有能力做AI大模型或行业模型？

自己的行业会不会出现新的AI产品？

新的AI产品会不会颠覆自己？

自己有没有能力做出那个AI产品？

自己原有产品如何基于AI新技术进行迭代创新？

自己基于大模型做微调做应用层创新？

基于国内外的哪个大模型做应用研发和产品创新？

不考虑大模型，直接用AIGC的产品或工具，简单粗暴降本增效？

……

最后，还有一点值得大家注意：

“十年前的传统观点认为，人工智能首先会影响体力劳动，然后是认知劳动，再然后，也许有一天可以做创造性工作。现在看起来，它会以相反的顺序进行。”

高科技投机机构ARK Invest预测，以AIGC为代表的新一代人工智能技术将辅助知识工作者（包括教师、律师、医生、财务、程序员等白领职业）提高工作效率。报告预测，到 2030 年，AI 将大幅提高知识工作者的工作效率，平均工作效率增加140%，新一代人工智能技术将有可能大幅度降低脑力劳动者的工作强度。如果这一切成为现实，或将是继人类历史上由于动力革命而摆脱繁重的体力劳动之后，人类社会发生的又一次伟大的技术革命。

上面引号里那句话，是ChatGPT创始人，山姆·阿尔特曼，说的。

他还说过一个观点：

“没必要担心被AI取代，人类和机器终将融为一体。”

以上文章内容仅代表原作者观点，不代表今日指点观点或立场。如有关于作品内容、版权或其它问题请于作品发表后的30日内与今日指点联系。

深度 | 啥是大模型？一篇文章看懂火遍全网的“AI大模型”

YouTube 影片如何分享到 IG 貼文或限動？教你用這招【Facebook教程】

推特如何查看已关注的人(推特如何查看点赞记录)

推特如何查看自己的点赞的帖子(推特如何查看自己的点赞的帖子数量 )

字节首个AI对话式APP“豆包”及其网页版正式上线

如何解决youtube music地区限制无法打开，并在手机上进行下载操作

Facebook 收不到通知？臉書通知不見了？教你5招輕鬆解決 | iPhoneTipSo

tiktok有哪些擦边跳舞博主，tiktok上很火的博主盘点

Twitter 为什么不直接显示图片？

推特查看历史记录（如何查看推特的历史记录）

twitter直播入口在哪

Discord光遇社区入门指南＆测试服申请教程

Discord下载及保姆使用教程附翻译插件

Midjourney手机版和电脑版的功能差异

discord项目mod申请,平板discord注册教程

新手必读，如何玩转Discord，那些你必须知道的小常识