Mixtral-8*7B开源模型生产环境部署优化 2块RTX4090 #小工蚁 05:53
训练大语言模型LLM 如何定义自己训练数据集?#小工蚁 13:40
如何微调开源Yi-34B成为Open LLM排名前三模型 #小工蚁 09:19
大语言模型构建新工具MergeKit 集百家之长融于一身 #小工蚁 09:39
国产首个开源MoE大模型DeepSeekMoE 16B #小工蚁 06:37
最强长上下文Text Embedding 开源模型M2-BERT 09:33
MiniMA-Chat-3B开源小模型 中英文双语 #小工蚁 04:57
智谱AI GLM4和InternLM2国产大语言模型更新迭代 #小工蚁 05:12
斯坦福开源RadixAttention算法 和SGLang语言,性能再翻5倍 08:01
让Mixtral-8*7B模型运行在16GB显存GPU上 #小工蚁 08:09
PatchTSMixer开源最强多变量 时间序列预测算法 09:05
开源InternLM2大模型测评 #小工蚁 05:34
AWQ和GPTQ大模型4bit量化 哪种算法更优?#小工蚁 03:18
Yi-VL开源最强多模态大模型 #小工蚁 04:56
突破极限:Yi-VL多模态模型惊艳亮相,推理加速性能压测演示 #小工蚁 13:24
Qwen1.5大模型春节前发布 阿里送大礼包看看有啥? 09:32
Qwen1.5系列6个模型如何选择? AWQ还是GPTQ?#小工蚁 07:49
中国开源1bit大模型量化算法BiLLM来啦 #小工蚁 08:56
Smaug开源大模型排行第一基于Qwen72B微调大模型 #小工蚁 04:22
大语言模型提示工程新框架 Self-Discover超越CoT 06:01
谷歌发布Gemini 1.5超长上下文 如何实现?UC伯克利告诉你 10:55
谷歌Gemini系列模型开源了,发布Gemma 2B和7B2个模型 #小工蚁 06:37
谷歌开源Gemma-7B大模型性能和中文能力测试 #小工蚁 02:50
谷歌公布无需提示工程CoT推理解码算法 #小工蚁 10:40
StarCoder2及数据集正式发布 #小工蚁 03:29
多GPU推理加速Qwen-72B开源大模型 #小工蚁 04:53
零一万物发布Yi-9B大模型,代码数学推理能力全面提升 #小工蚁 07:04
零一万物开源大模型Yi-9B测试,性能到底如何?#小工蚁 08:52
LMSYS全球大模型PK排行榜 Qwen1.5-72B开源排名第一 #小工蚁 05:44
大语言模型企业应用排行榜,哪个模型最强?#小工蚁 04:38
揭晓答案:Qwen-72B和Yi-34B生产部署性能哪个更强? 08:01
通义千问Qwen1.5多个LoRA 同时部署和推理加速演示 #小工蚁 13:54
Qwen1.5-72B上下文推理准确度评估演示16K时最优 #小工蚁 03:43
马斯克开源全球最大模型Grok 8个专家模型组成314B神经网络 06:19
腾讯开源LlaMA Pro增强LLM性能 新方法,打造行业模型 #小工蚁 06:20
Embedding模型8bit量化推理 成本下降4倍,准确度下降0.7% 07:22
Databricks开源超千亿规模 大模型DBRX,性能超Grok 04:48
阿里开源Qwen1.5-MoE模型 评测性能究竟如何? 08:32
阿里开源Qwen1.5-MOE-A2.7B CEval评测 #小工蚁 02:53
近期开源4个MoE大模型哪个最优?DBRX?Qwen? 05:53
Jamba开源模型性能超越 Mixtral8*7B 采用最先进混合架构 10:15
开源通义千问Qwen1.5系列 14B和MoE2.7B哪个更好? #小工蚁 #gpu 04:56
Command R专为RAG应用场景开发的大语言模型 #小工蚁 07:17
通义千问开源Qwen1.5-72B RAG海底捞针评测 #小工蚁 02:39
Command-R开源大语言模型测评 #小工蚁 03:32
通义千问开源Qwen1.5-32B 模型对比14B、72B性能如何? 04:59
通义千问1.5 32B和72B大模型性能对比2 #小工蚁 07:23
谷歌更新Transformer架构MoD 节省计算资源,提高模型性能 #小工蚁 07:32
MiniCPM-2B和MoE-8x2B模型 开源最强“小模型” #小工蚁 07:03
Llama3和Llama2模型全面对比 #小工蚁 07:33
通义千问千亿大模型开源性能超LLaMA-3-70B #小工蚁 03:20
通义千问千亿模型比720亿模型更省算力 #小工蚁 04:15
SQLEval Text2SQL能力评估实践 #小工蚁 05:05
将LLaMA3上下文长度从8K扩展 到超过100万 05:03
DeepSeek V2开源大模型为什么可以节省90% 以上KV Cache? 09:23
商汤开源Piccolo2大模型有啥亮点?#小工蚁 05:23
谷歌开源视觉大模型PaliGemma 06:54
多模态Embedding开源模型 Visualized BGE #小工蚁 03:44
飞鹰2系列:11B LLM和VLM支持欧洲11国语言 #小工蚁 05:56
VLM视觉大模型如何评测?MMMU排行榜 #小工蚁 04:47
VLM多模态开源大模型发展迅速 下半年将成为主流 02:34
近期开源VLM大模型介绍 #小工蚁 09:52
Fish Speech V1.1发布支持Mac API流式推理演示 #小工蚁 03:33
阿里通义千问Qwen2大模型开源发布 7B达到上一代72B能力 #小工蚁 03:01
清华智谱chatglm4-9b-chat和qwen2-7b-chat哪个更强? 05:35
Yi-1.5-9b Ceval评测和Qwen2-7b glm-9b谁更强? 02:22
LLaMA3-8大模型FP8推理加速 优势(更快更省)和演示 07:55
Qwen2-72-Instruct Ceval评测 中英文双语最强开源模型? 02:50
Stable Diffusion 3开源发布 文生图大模型媲美闭源商业模型 07:04
英伟达开源Nemotran4-340B大模型,性能直逼GPT4 #小工蚁 10:34
大模型提示工程技术 调研报告(上) 07:58
大模型提示工程技术 调研报告(下) 11:26
谷歌开源gemma2大语言模型用了啥新技术? 05:47
RouteLLM大模型GPT4o调用成本下降85%,性能达到95% 06:06
Mistral联合英伟达开发 NeMo 12B大模型支持中文 #小工蚁 03:18
Mistral-NeMo FP8推理加速 01:53
UC伯克利大模型调用函数排行榜,准确率高吗?#小工蚁 07:07
Meta开源LLaMA3.1 405B超大规模模型,性能直逼全球最强 #小工蚁 02:05
LLaMA3.1-8B性能评测 如何运行性能最优?#小工蚁 02:23
Mistral开源Large 123B性能直逼LLaMA3.1 405B 04:28
LLaMA-3.1 8B中文能力如何?Ceval评测 #小工蚁 02:04
采访Meta科学家LLaMA3.1 405B是如何炼成的?#小工蚁 10:05
Google Gemma2 2B发布小模型性能同样强大 #小工蚁 03:33
抱抱脸开源小模型SmolLM和训练数据集 #小工蚁 08:25
Qwen2-Audio语音多模态大模型使用实践 #小工蚁 03:51
清华智谱开源生成视频大模型CogVideo 03:44
纯Memba架构大语言模型开源性能超越Transformer #小工蚁 #memba 11:15
Qwen2-7B-Instruct不同量化方法准确度和性能比较 04:37
微软开源Phi-3.5系列3个模型 小而强 03:54
ggml开源大模型推理轻量框架 支持手机推理大模型 04:27
微软开源Phi-3.5-mini-Instruct测评 03:02
Qwen2-VL通义千问多模态大模型能做什么?性能如何? #小工蚁 04:17
Jamba1.5开源大模型同等性能降低10倍KV Cache 07:13
MiniCPM3-4B开源 4B参数挑战7B性能!真的吗? #小工蚁 04:48
Reflection开源,让大模型学习“反思” 05:01
MemLong:提高大模型上下文的“外挂” #小工蚁 07:09
LLaMA-Omni开源语言对话大模型,超低延时 #小工蚁 07:31
通义千问2.5 7B-Instruct模型 C-eval评测 #小工蚁 02:18
阿里开源通义千问2.5系列大模型 #小工蚁 06:08
LongCite让大模型精准找到引用,智能回答更准确 #小工蚁 08:42
Qwen2.5-Coder写代码大模型技术报告解读 #小工蚁 07:20
Qwen2-72B大模型推理性能对比 4张RTX4090对比2张L20 02:29
Qwen2-72B性能对比 英伟达RTX4090和L20各4卡 03:18
Jina Embedding v3开源多语言嵌入大模型 10:07
MOSHI实时对话大模型 有啥技术亮点? 12:06
Meta发布LLaMA3.2多模态大模型 #小工蚁 07:32
阿里通义开源2个声音大模型SenseVoice和CosyVoice #小工蚁 08:34
通义千问2.5-72B大模型性能测试 Split-Fuse降低首个Token时间 #小工蚁 04:23
阿里通义千问2视觉大模型 #小工蚁 08:15
LLM投机解码实践和优化 #小工蚁 05:49
OCR-2.0开源小模型实现OCR端到端应用 #小工蚁 #pdf转markdown 05:04
开源最强VLM Molmo #小工蚁 05:08
如何降低通义千问72B大模型 首个Token延时 02:36
EMU3大统一的多模态大模型 #小工蚁 04:16
探究模型亲缘关系以合并大语言模型 #小工蚁 08:58
Aya Expanse开源大模型 支持多语言(中文),小且强 #小工蚁 05:08
TableGPT2针对表格问答场景开源大模型,性能超GPTo 10:07
腾讯开源混元大模型 MoE架构389B参数 #小工蚁 06:37
Qwen2.5-Coder阿里开源代码生成大模型 #小工蚁 03:34
上海AI创业团队开源OpenCoder代码生成大模型 07:04
抱抱脸开源SmolLM2 小模型运行在各种终端设备上 02:45
你信吗?一个弹窗就能让AI宕机!#小工蚁 05:40
大模型如何理解数字及如何改善? 13:12
国内类o1开源大模型纷纷发布,数学能力大幅提升 02:00
上海人工智能实验室开源视觉大模型InternVL2.5 #小工蚁 03:19
google开源Piligemma视觉大模型 09:33
模拟人类感知能力实时交互大模型IXC2.5-OL开源 #小工蚁 10:20
OpenAI官宣新一代最强模型o3有啥亮点? 05:29
通义千问2.5技术报告 #小工蚁 08:12
视觉大模型OCR全面评测 04:33
RAG新基座模型升级 ModernBert 06:47
全球首个半导体大模型SemiKong如何炼成的?#小工蚁 16:14
Meta推出全新Large Concept Models #小工蚁 04:52
Fish Speech 1.5 TTS开源模型 03:47
OLMO真正开源大模型 04:33
CosyVoice2开源TTS流式大模型 实时语音“说” 07:27
DeepSeek V3技术报告深度解读 10:11
DeepSeek R1开源推理大模型 性能对标OpenAI o1 03:23
DeepSeek R1技术报告解读 性能比肩OpenAI o1 18:59
Mac运行VLLM推理DeekSeek R1蒸馏Qwen7B演示 02:58
通义千问视觉大模型VS人类 谁更懂图? 05:15
抱抱脸发起复制DeepSeek R1开源项目Open-R1 #小工蚁 #deepseek 07:11
DeepSeekR1大模型多服务器分布式推理部署揭秘 09:02
腾讯发现DeepSeek推理大模型 有欠思考问题 07:18
华佗医疗推理大模型 蒸馏大模型o1推理能力 09:38
免费体验华为云32卡910B3 满血版DeepSeek R1 05:17
如何让DeepSeek R1推理大模型具有多模态能力? 03:33
文生视频大模型大盘点 06:44
通义千问最新视觉大模型VL2.5-7B OCR演示 02:57
企业独立部署DeepSeek R1最佳性价比实践 04:35
DeepSeek发布新算法NSA让大模型推理成本再降11倍 10:48
VLLM实现MLA注意力DeepSeek模型吞吐量大幅提升 03:16
谷歌发布更强视觉编码器 SigLIP2 04:09
QwQ-32B和DeepSeek蒸馏版压力测试性能对比 04:27
QwQ-32B和DeepSeek R1 32BCeval评估对比 04:49
RTX 4090 10卡双机运行DeepSeek 671B性能如何? 07:17
谷歌开源Gemma 3 27B 多模态大模型震撼来袭! 08:00
AI应用安全: 如何检测和识别潜在风险? 04:24
谷歌开源Gemma-3-27B压测 04:16
后训练推理大模型全面调查 08:41
Mistral Small 3.1多语言 SOTA开源多模态模型 03:10
通义千问Qwen3和Qwen3MoE 即将发布 03:06
Meta开源Llama4 04:31
2024大模型狂飙突进 13:38
重新审视大型推理模型中的提示优化 06:41
上海人工智能实验室开源视觉大模型InternVL3 04:55
人工智能简史 第5章: 神经网络简史 04:17