Mixtral-8*7B开源模型生产环境部署优化 2块RTX4090 #小工蚁 05:53

训练大语言模型LLM 如何定义自己训练数据集?#小工蚁 13:40

如何微调开源Yi-34B成为Open LLM排名前三模型 #小工蚁 09:19

大语言模型构建新工具MergeKit 集百家之长融于一身 #小工蚁 09:39

国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁 06:37

最强长上下文Text Embedding 开源模型M2-BERT 09:33

MiniMA-Chat-3B开源小模型 中英文双语 #小工蚁 04:57

智谱AI GLM4和InternLM2国产大语言模型更新迭代 #小工蚁 05:12

斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍 08:01

让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁 08:09

PatchTSMixer开源最强多变量 时间序列预测算法 09:05

开源InternLM2大模型测评 #小工蚁 05:34

AWQ和GPTQ大模型4bit量化 哪种算法更优?#小工蚁 03:18

Yi-VL开源最强多模态大模型 #小工蚁 04:56

突破极限:Yi-VL多模态模型惊艳亮相,推理加速性能压测演示 #小工蚁 13:24

Qwen1.5大模型春节前发布 阿里送大礼包看看有啥? 09:32

Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁 07:49

中国开源1bit大模型量化算法BiLLM来啦 #小工蚁 08:56

Smaug开源大模型排行第一基于Qwen72B微调大模型 #小工蚁 04:22

大语言模型提示工程新框架 Self-Discover超越CoT 06:01

谷歌发布Gemini 1.5超长上下文 如何实现?UC伯克利告诉你 10:55

谷歌Gemini系列模型开源了,发布Gemma 2B和7B2个模型 #小工蚁 06:37

谷歌开源Gemma-7B大模型性能和中文能力测试 #小工蚁 02:50

谷歌公布无需提示工程CoT推理解码算法 #小工蚁 10:40

StarCoder2及数据集正式发布 #小工蚁 03:29

多GPU推理加速Qwen-72B开源大模型 #小工蚁 04:53

零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁 07:04

零一万物开源大模型Yi-9B测试,性能到底如何?#小工蚁 08:52

LMSYS全球大模型PK排行榜 Qwen1.5-72B开源排名第一 #小工蚁 05:44

大语言模型企业应用排行榜,哪个模型最强?#小工蚁 04:38

揭晓答案:Qwen-72B和Yi-34B生产部署性能哪个更强? 08:01

通义千问Qwen1.5多个LoRA 同时部署和推理加速演示 #小工蚁 13:54

Qwen1.5-72B上下文推理准确度评估演示16K时最优 #小工蚁 03:43

马斯克开源全球最大模型Grok 8个专家模型组成314B神经网络 06:19

腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁 06:20

Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7% 07:22

Databricks开源超千亿规模 大模型DBRX,性能超Grok 04:48

阿里开源Qwen1.5-MoE模型 评测性能究竟如何? 08:32

阿里开源Qwen1.5-MOE-A2.7B CEval评测 #小工蚁 02:53

近期开源4个MoE大模型哪个最优?DBRX?Qwen? 05:53

Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构 10:15

开源通义千问Qwen1.5系列 14B和MoE2.7B哪个更好? #小工蚁 #gpu 04:56

Command R专为RAG应用场景开发的大语言模型 #小工蚁 07:17

通义千问开源Qwen1.5-72B RAG海底捞针评测 #小工蚁 02:39

Command-R开源大语言模型测评 #小工蚁 03:32

通义千问开源Qwen1.5-32B 模型对比14B、72B性能如何? 04:59

通义千问1.5 32B和72B大模型性能对比2 #小工蚁 07:23

谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁 07:32

MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁 07:03

Llama3和Llama2模型全面对比 #小工蚁 07:33

通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁 03:20

通义千问千亿模型比720亿模型更省算力 #小工蚁 04:15

SQLEval Text2SQL能力评估实践 #小工蚁 05:05

将LLaMA3上下文长度从8K扩展 到超过100万 05:03

DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache? 09:23

商汤开源Piccolo2大模型有啥亮点?#小工蚁 05:23

谷歌开源视觉大模型PaliGemma 06:54

多模态Embedding开源模型 Visualized BGE #小工蚁 03:44

飞鹰2系列:11B LLM和VLM支持欧洲11国语言 #小工蚁 05:56

VLM视觉大模型如何评测?MMMU排行榜 #小工蚁 04:47

VLM多模态开源大模型发展迅速 下半年将成为主流 02:34

近期开源VLM大模型介绍 #小工蚁 09:52

Fish Speech V1.1发布支持Mac API流式推理演示 #小工蚁 03:33

阿里通义千问Qwen2大模型开源发布 7B达到上一代72B能力 #小工蚁 03:01

清华智谱chatglm4-9b-chat和qwen2-7b-chat哪个更强? 05:35

Yi-1.5-9b Ceval评测和Qwen2-7b glm-9b谁更强? 02:22

LLaMA3-8大模型FP8推理加速 优势(更快更省)和演示 07:55

Qwen2-72-Instruct Ceval评测 中英文双语最强开源模型? 02:50

Stable Diffusion 3开源发布 文生图大模型媲美闭源商业模型 07:04

英伟达开源Nemotran4-340B大模型,性能直逼GPT4 #小工蚁 10:34

大模型提示工程技术 调研报告(上) 07:58

大模型提示工程技术 调研报告(下) 11:26

谷歌开源gemma2大语言模型用了啥新技术? 05:47

RouteLLM大模型GPT4o调用成本下降85%,性能达到95% 06:06

Mistral联合英伟达开发 NeMo 12B大模型支持中文 #小工蚁 03:18

Mistral-NeMo FP8推理加速 01:53

UC伯克利大模型调用函数排行榜,准确率高吗?#小工蚁 07:07

Meta开源LLaMA3.1 405B超大规模模型,性能直逼全球最强 #小工蚁 02:05

LLaMA3.1-8B性能评测 如何运行性能最优?#小工蚁 02:23

Mistral开源Large 123B性能直逼LLaMA3.1 405B 04:28

LLaMA-3.1 8B中文能力如何?Ceval评测 #小工蚁 02:04

采访Meta科学家LLaMA3.1 405B是如何炼成的?#小工蚁 10:05

Google Gemma2 2B发布小模型性能同样强大 #小工蚁 03:33

抱抱脸开源小模型SmolLM和训练数据集 #小工蚁 08:25

Qwen2-Audio语音多模态大模型使用实践 #小工蚁 03:51

清华智谱开源生成视频大模型CogVideo 03:44

纯Memba架构大语言模型开源性能超越Transformer #小工蚁 #memba 11:15

Qwen2-7B-Instruct不同量化方法准确度和性能比较 04:37

微软开源Phi-3.5系列3个模型 小而强 03:54

ggml开源大模型推理轻量框架 支持手机推理大模型 04:27

微软开源Phi-3.5-mini-Instruct测评 03:02

Qwen2-VL通义千问多模态大模型能做什么?性能如何? #小工蚁 04:17

Jamba1.5开源大模型同等性能降低10倍KV Cache 07:13

MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁 04:48

Reflection开源,让大模型学习“反思” 05:01

MemLong:提高大模型上下文的“外挂” #小工蚁 07:09

LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁 07:31

通义千问2.5 7B-Instruct模型 C-eval评测 #小工蚁 02:18

阿里开源通义千问2.5系列大模型 #小工蚁 06:08

LongCite让大模型精准找到引用,智能回答更准确 #小工蚁 08:42

Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁 07:20

Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20 02:29

Qwen2-72B性能对比 英伟达RTX4090和L20各4卡 03:18

Jina Embedding v3开源多语言嵌入大模型 10:07

MOSHI实时对话大模型 有啥技术亮点? 12:06

Meta发布LLaMA3.2多模态大模型 #小工蚁 07:32

阿里通义开源2个声音大模型SenseVoice和CosyVoice #小工蚁 08:34

通义千问2.5-72B大模型性能测试 Split-Fuse降低首个Token时间 #小工蚁 04:23

阿里通义千问2视觉大模型 #小工蚁 08:15

LLM投机解码实践和优化 #小工蚁 05:49

OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown 05:04

开源最强VLM Molmo #小工蚁 05:08

如何降低通义千问72B大模型 首个Token延时 02:36

EMU3大统一的多模态大模型 #小工蚁 04:16

探究模型亲缘关系以合并大语言模型 #小工蚁 08:58

Aya Expanse开源大模型 支持多语言(中文),小且强 #小工蚁 05:08

TableGPT2针对表格问答场景开源大模型,性能超GPTo 10:07

腾讯开源混元大模型 MoE架构389B参数 #小工蚁 06:37

Qwen2.5-Coder阿里开源代码生成大模型 #小工蚁 03:34

上海AI创业团队开源OpenCoder代码生成大模型 07:04

抱抱脸开源SmolLM2 小模型运行在各种终端设备上 02:45

你信吗?一个弹窗就能让AI宕机!#小工蚁 05:40

大模型如何理解数字及如何改善? 13:12

国内类o1开源大模型纷纷发布,数学能力大幅提升 02:00

上海人工智能实验室开源视觉大模型InternVL2.5 #小工蚁 03:19

google开源Piligemma视觉大模型 09:33

模拟人类感知能力实时交互大模型IXC2.5-OL开源 #小工蚁 10:20

OpenAI官宣新一代最强模型o3有啥亮点? 05:29

通义千问2.5技术报告 #小工蚁 08:12

视觉大模型OCR全面评测 04:33

RAG新基座模型升级 ModernBert 06:47

全球首个半导体大模型SemiKong如何炼成的?#小工蚁 16:14

Meta推出全新Large Concept Models #小工蚁 04:52

Fish Speech 1.5 TTS开源模型 03:47

OLMO真正开源大模型 04:33

CosyVoice2开源TTS流式大模型 实时语音“说” 07:27

DeepSeek V3技术报告深度解读 10:11

DeepSeek R1开源推理大模型 性能对标OpenAI o1 03:23

DeepSeek R1技术报告解读 性能比肩OpenAI o1 18:59

Mac运行VLLM推理DeekSeek R1蒸馏Qwen7B演示 02:58

通义千问视觉大模型VS人类 谁更懂图? 05:15

抱抱脸发起复制DeepSeek R1开源项目Open-R1 #小工蚁 #deepseek 07:11

DeepSeekR1大模型多服务器分布式推理部署揭秘 09:02

腾讯发现DeepSeek推理大模型 有欠思考问题 07:18

华佗医疗推理大模型 蒸馏大模型o1推理能力 09:38

免费体验华为云32卡910B3 满血版DeepSeek R1 05:17

如何让DeepSeek R1推理大模型具有多模态能力? 03:33

文生视频大模型大盘点 06:44

通义千问最新视觉大模型VL2.5-7B OCR演示 02:57

企业独立部署DeepSeek R1最佳性价比实践 04:35

DeepSeek发布新算法NSA让大模型推理成本再降11倍 10:48

VLLM实现MLA注意力DeepSeek模型吞吐量大幅提升 03:16

谷歌发布更强视觉编码器 SigLIP2 04:09

QwQ-32B和DeepSeek蒸馏版压力测试性能对比 04:27

QwQ-32B和DeepSeek R1 32BCeval评估对比 04:49

RTX 4090 10卡双机运行DeepSeek 671B性能如何? 07:17

谷歌开源Gemma 3 27B 多模态大模型震撼来袭! 08:00

AI应用安全: 如何检测和识别潜在风险? 04:24

谷歌开源Gemma-3-27B压测 04:16

后训练推理大模型全面调查 08:41

Mistral Small 3.1多语言 SOTA开源多模态模型 03:10

通义千问Qwen3和Qwen3MoE 即将发布 03:06

Meta开源Llama4 04:31

2024大模型狂飙突进 13:38

重新审视大型推理模型中的提示优化 06:41

上海人工智能实验室开源视觉大模型InternVL3 04:55

人工智能简史 第5章: 神经网络简史 04:17