总结一下通过国家工信部11个AI大模型,再推荐两个本人经常用觉得很惊艳的模型
**北京5家:**百度(文心一言)、字节抖音(云雀大模型)、智谱AI(GLM智谱清言)、中科院(紫东太初)、百川智能(百川大模型)
**上海3家:**商汤(商量)、MiniMax(ABAB大模型)、上海人工智能实验室(书生大模型])
**广东2家:**华为(盘古大模型)、腾讯(混元大模型)
**安徽1家:**科大讯飞(星火大模型)
1、百度:文心一言
总的来说,目前文心一言4.0是最逼近ChatGPT的大模型
2、字节抖音:云雀
目前支持网页Web平台、iOS 以及安卓平台,用户可通过手机号、抖音或者Apple ID登录使用。
3、智谱AI:智谱清言
智谱科技最近发布的GLM-4基座大模型,作为国内对标OpenAI产品线的重要一步,引起了广泛关注。根据智谱的官方说法,GLM-4在性能上相比GLM-3提升了60%,接近GPT-4的最新水平。
「智谱清言」已在各大应用商店上线,用户可通过苹果商店 App Store、安卓主流商店(包括华为、OPPO、vivo 及小米等)进行下载,或在微信小程序中搜索「智谱清言」体验其功能。
4、中科院-紫东太初
中国科学院自动化研究所“紫东太初”多模态大模型研究团队自成立以来,围绕人工智能前沿技术进行了不懈探索,成功研发全球首个千亿参数多模态大模型“紫东太初”,开拓性地实现了图像、文本、语音三个模态数据之间的“统一表示”与“相互生成”,理解和生成能力更接近人类,向通用人工智能迈出了重要一步。
5、百川智能:百川大模型
目前已经发展到Baichuan2-13B、Baichuan2-7B
百川智能成立于2023年4月10日,由前搜狗公司CEO王小川创立。公司以帮助大众轻松、普惠地获取世界知识和专业服务为使命,致力于通过语言AI的突破,构建中国最优秀的大模型底座。公司核心团队由来自搜狗、百度、华为、微软、字节、腾讯等知名科技公司的AI顶尖人才组成。百川智能成立不到100天,便发布了Baichuan-7B、Baichuan-13B两款开源可免费商用的中文大模型,且在多个权威评测榜单均名列前茅,下载量突破百万
6、华为:盘古大模型
2023年7月7日,华为发布盘古大模型3.0.“不作诗、只做事”、“AI 重塑千行百业”、“[AI for Industries](https://www.zhihu.com/search?q=AI for Industries&search_source=Entity&hybrid_search_source=Entity&hybrid_search_extra={“sourceType”%3A"answer"%2C"sourceId"%3A3365858362}) ”华为的盘古大模型聚焦行业价值场景,围绕行业重塑、技术扎根、开放同飞三大方向,为行业客户提供服务。盘古大模型3.0是一个完全面向行业的大模型系列,包括5+N+X三层架构。
7、腾讯:混元大模型
直到2023年6月19日,腾讯才姗姗来迟地开了场发布会。腾讯对外公布行业大模型研发进展,宣布将助力企业构建专属大模型及智能应用,为企业提供MaaS一站式服务。
8、科大讯飞:星火大模型
“讯飞星火认知大模型”是科大讯飞发布的产品,具有7大核心能力,即文本生成、语言理解、知识问答、逻辑推理、数学能力、代码能力、多模态能力。2023年5月6日,科大讯飞正式发布星火认知大模型。
9、商汤-日日新大模型
日日新(SenseNova),是商汤科技宣布推出的大模型体系,包括自然语言处理模型“商量”(SenseChat)、文生图模型“秒画”和数字人视频生成平台“如影”(SenseAvatar)等。2023年4月,商汤科技董事长兼首席执行官徐立宣布推出“日日新SenseNova”大模型体系 [1-2]。2023年8月,日日新大模型获批上线。
10、Minimax:ABAB大模型
2021年,由前商汤科技副总裁、通用智能技术负责人闫俊杰成立Minimax 。2023年6月,据路透报道,Minimax完成了新一轮2.5亿美元融资后,整体估值超过12亿美元。Minimax已经发布了包括文本到视觉/语音/文本三个基础模型架构,并推出自研通用大模型“ABAB”。
11、上海人工智能实验室-书生大模型
上海人工智能实验室(又称浦江实验室)成立于2020年,由上海人工智能创新中心发起设立。2021年,浦江实验室联合商汤、香港中文大学、上海交通大学发布通用视觉技术体系“书生”(INTERN)。到如今,书生大模型体系参数已达千亿级别,包括“书生·多模态”、“书生·浦语”和“书生·天际”等三大基础模型,以及面向大模型研发与应用的开源体系。
再推荐两个平时经常用觉得很惊艳的大模型
由月之暗面科技有限公司(Moonshot AI)开发。擅长中英文对话,可以获取信息、解答疑问,甚至阅读和理解提供的文件内容。无论是TXT、PDF、Word文档、PPT幻灯片还是Excel电子表格,能轻松应对。还可以解析网页链接。最强大的是kimiChat大海捞针通过率100%。
通义听悟
平时学习看视频总结的好帮手
通义听悟可以在会议、学习、访谈、培训等场景下:
- 实时记录交流内容,同步翻译批量转写音视频文件,区分发言人智能提炼全文概要、章节速览、发言总结提取视频中的PPT并总结摘要自动提取关键词、待办事项编辑整理笔记,导出、分享记录
交流内容,同步翻译
- 批量转写音视频文件,区分发言人智能提炼全文概要、章节速览、发言总结提取视频中的PPT并总结摘要自动提取关键词、待办事项编辑整理笔记,导出、分享记录
今天就分享到这里,我是西西,我的理想是带领10w小白学会AI,使用AI。
👉AI大模型学习路线汇总👈
第二阶段: 在通过大模型提示词工程从Prompts角度入手更好发挥模型的作用;
第三阶段: 大模型平台应用开发借助阿里云PAI平台构建电商领域虚拟试衣系统;
第四阶段: 大模型知识库应用开发以LangChain框架为例,构建物流行业咨询智能问答系统;
第五阶段: 大模型微调开发借助以大健康、新零售、新媒体领域构建适合当前领域大模型;
第六阶段: 以SD多模态大模型为主,搭建了文生图小程序案例;
第七阶段: 以大模型平台应用与开发为主,通过星火大模型,文心大模型等成熟大模型构建大模型行业应用。
👉大模型实战案例👈
光学理论是没用的,要学会跟着一起做,要动手实操,才能将自己的所学运用到实际当中去,这时候可以搞点实战案例来学习。
👉大模型视频和PDF合集👈
👉学会后的收获:👈
• 基于大模型全栈工程实现(前端、后端、产品经理、设计、数据分析等),通过这门课可获得不同能力;
• 能够利用大模型解决相关实际项目需求: 大数据时代,越来越多的企业和机构需要处理海量数据,利用大模型技术可以更好地处理这些数据,提高数据分析和决策的准确性。因此,掌握大模型应用开发技能,可以让程序员更好地应对实际项目需求;
• 基于大模型和企业数据AI应用开发,实现大模型理论、掌握GPU算力、硬件、LangChain开发框架和项目实战技能, 学会Fine-tuning垂直训练大模型(数据准备、数据蒸馏、大模型部署)一站式掌握;
• 能够完成时下热门大模型垂直领域模型训练能力,提高程序员的编码能力: 大模型应用开发需要掌握机器学习算法、深度学习框架等技术,这些技术的掌握可以提高程序员的编码能力和分析能力,让程序员更加熟练地编写高质量的代码。
👉获取方式:
保证100%免费