• CrisperWhisper:精确到词级的自动语音识别模型 CrisperWhisper是基于OpenAI的Whisper模型的高级变体,专为快速、准确、逐字的语音识别设计,提供准确的词级时间戳。与原始Whisper模型相比,CrisperWhisper旨在逐字转录每一个说出的单词,包括填充词、停顿、口吃和错误的开始。该模型在逐字数据集(如TED、AMI)中排名第一,并在INTERSPEECH 2024上被接受。 自动语音识别 逐字转录 时间戳
  • Svd Keyframe Interpolation:使用SVD技术进行关键帧插值的动画工具 Svd Keyframe Interpolation 是一个基于奇异值分解(SVD)技术的关键帧插值模型,用于在动画制作中自动生成中间帧,从而提高动画师的工作效率。该技术通过分析关键帧的特征,自动计算出中间帧的图像,使得动画更加流畅自然。它的优势在于能够减少动画师手动绘制中间帧的工作量,同时保持高质量的动画效果。 动画 关键帧插值 SVD
  • Generative Keyframe Interpolation with Forward-Backward Consistency:利用预训练的图像到视频扩散模型生成连贯中间帧 该产品是一个图像到视频的扩散模型,通过轻量级的微调技术,能够从一对关键帧生成具有连贯运动的连续视频序列。这种方法特别适用于需要在两个静态图像之间生成平滑过渡动画的场景,如动画制作、视频编辑等。它利用了大规模图像到视频扩散模型的强大能力,通过微调使其能够预测两个关键帧之间的视频,从而实现前向和后向的一致性。 图像到视频 扩散模型 关键帧插值
  • RECE:一种用于文本到图像扩散模型的概念擦除技术 RECE是一种文本到图像扩散模型的概念擦除技术,它通过在模型训练过程中引入正则化项来实现对特定概念的可靠和高效擦除。这项技术对于提高图像生成模型的安全性和控制性具有重要意义,特别是在需要避免生成不适当内容的场景中。RECE技术的主要优点包括高效率、高可靠性和易于集成到现有模型中。 文本到图像 概念擦除 图像生成
  • Follow-Your-Canvas:高分辨率视频外延与内容生成技术 Follow-Your-Canvas 是一种基于扩散模型的视频外延技术,它能够生成高分辨率的视频内容。该技术通过分布式处理和空间窗口合并,解决了GPU内存限制问题,同时保持了视频的空间和时间一致性。它在大规模视频外延方面表现出色,能够将视频分辨率显著提升,如从512 X 512扩展到1152 X 2048,同时生成高质量和视觉上令人愉悦的结果。 视频外延 内容生成 扩散模型
  • Flux Gym:简洁的FLUX LoRA训练UI,支持低VRAM配置。 Flux Gym是一个为FLUX LoRA模型训练设计的简洁Web UI,特别适合只有12GB、16GB或20GB VRAM的设备使用。它结合了AI-Toolkit项目的易用性和Kohya Scripts的灵活性,使得用户无需复杂的终端操作即可进行模型训练。Flux Gym支持用户通过简单的界面上传图片和添加描述,然后启动训练过程。 AI训练 机器学习 Web界面
  • DeepSeek-V2.5:集成了通用和编程能力的人工智能模型 DeepSeek-V2.5 是一个升级版本,结合了 DeepSeek-V2-Chat 和 DeepSeek-Coder-V2-Instruct 的功能。这个新模型整合了两个先前版本的通用和编程能力,更好地符合人类的偏好,并在写作和指令遵循等多个方面进行了优化。 人工智能 机器学习 自然语言处理
  • 西湖心辰:多模态大模型,赋能企业智能化转型。 西湖心辰是心辰智能云旗下的一款多模态大模型产品,它集成了先进的人工智能技术,包括自然语言处理、机器学习和数据挖掘等,旨在为企业提供全面的AI解决方案。西湖心辰通过其高情商、高智商的AI能力,帮助企业在客服、销售、人事、研发和运营等多个领域实现智能化升级,提升工作效率和服务质量。 AI 大模型 企业服务
  • Runway Staff Picks:精选短片和实验作品,探索创意与技术的融合。 Runway Staff Picks 是一个展示使用 Runway Gen-3 Alpha 技术创作的精选短片和实验作品的平台。这些作品涵盖了从艺术到科技的多个领域,展示了 Runway 在视频创作和实验艺术方面的前沿技术。Runway 与 Tribeca Festival 2024 合作,通过与 Media.Monks 的合作,进一步扩展了创意的边界。 创意 实验 视频制作
  • 造梦日记:AI绘画创作平台,将文字描述转化为艺术画作。 造梦日记是一个利用人工智能技术将用户的文字描述转化为艺术画作的在线平台。它通过先进的AI算法,让用户只需输入简单的文字描述,即可快速生成具有特定风格和主题的画作。这项技术不仅为艺术家和设计师提供了新的创作工具,也为普通用户提供了一种全新的艺术体验方式。造梦日记支持中英文输入,操作简单,生成速度快,适合各类用户使用。 AI绘画 艺术创作 在线平台
  • 白日梦:文生视频类AIGC创作平台 白日梦AI是一个创新的文生视频类AIGC创作平台,它利用人工智能技术,让用户能够轻松创作出高质量的视频内容。平台提供文生视频、动态画面生成、AI角色生成等功能,同时确保人物与场景的一致性,极大地丰富了视频创作的多样性和专业性。 AIGC 文生视频 AI创作
  • Reshot AI:AI照片编辑器,专业重拍您的个人照片。 Reshot AI是一个利用人工智能技术的专业照片编辑器,专注于个人照片、YouTube缩略图等的优化。它通过AI技术,可以调整表情、面部姿态、光线、背景等,帮助用户快速生成高质量的专业照片。Reshot AI提供了多种编辑选项,并且用户拥有编辑后照片的完全商业使用权。该产品适合需要快速提升社交媒体形象和专业形象的用户,通过AI技术,Reshot AI能够在短时间内提供多种优化方案,大大提高了编辑效率。 AI照片编辑 个人照片优化 社交媒体
  • 西湖大模型:情商智商俱佳的多模态大模型 西湖大模型是心辰智能云推出的一款具有高情商和智商的多模态大模型,它能够处理包括文本、图像、声音等多种数据类型,为用户提供智能对话、写作、绘画、语音等AI服务。该模型通过先进的人工智能算法,能够理解和生成自然语言,适用于多种场景,如心理咨询、内容创作、客户服务等,具有高度的定制性和灵活性。西湖大模型的推出,标志着心辰智能云在AI领域的技术实力和创新能力,为用户提供了更加丰富和高效的智能服务体验。 人工智能 多模态 自然语言处理
  • NVIDIA DLI Teaching Kits:NVIDIA深度学习教学套件,助力教育者融入GPU课程。 NVIDIA DLI Teaching Kits是由NVIDIA深度学习研究所(DLI)提供的一套教学资源,旨在帮助大学教育者将GPU技术融入到他们的课程中。这些教学套件与领先的大学教师共同开发,提供完整的课程设计和易于使用的资源,使教育者能够将学术理论与现实世界的应用相结合,培养下一代创新者的关键计算技能。大多数教学套件现在也作为现成的Canvas LMS课程提供。 深度学习 GPU 教育
  • M&M VTO:多件服装虚拟试穿和编辑技术 M&M VTO是一种混合搭配的虚拟试穿方法,它接受多张服装图片、服装布局的文本描述以及一个人的图片作为输入,输出是这些服装在指定布局下穿在给定人物身上的可视化效果。该技术的主要优点包括:单阶段扩散模型,无需超分辨率级联,能够在1024x512分辨率下混合搭配多件服装,同时保留和扭曲复杂的服装细节;架构设计(VTO UNet Diffusion Transformer)能够分离去噪和人物特定特征,实现高效的身份保留微调策略;通过文本输入控制多件服装的布局,专门针对虚拟试穿任务微调。M&M VTO在定性和定量方面都达到了最先进的性能,并为通过语言引导和多件服装试穿开辟了新的可能性。 虚拟试穿 服装搭配 图像编辑
  • 心辰Lingo语音大模型:沟通无界,让每次对话都创造价值。 心辰Lingo语音大模型是一款先进的人工智能语音模型,专注于提供高效、准确的语音识别和处理服务。它能够理解并处理自然语言,使得人机交互更加流畅和自然。该模型背后依托西湖心辰强大的AI技术,致力于在各种场景下提供高质量的语音交互体验。 语音识别 自然语言处理 人工智能
  • ColorJoyful:AI着色页生成器,释放您的想象力。 ColorJoyful是一个利用人工智能技术创建着色页的在线平台,它通过先进的算法将用户的文字描述转换成着色页,生成清晰的线条图,便于用户进行涂色。该平台不仅提供了一个释放创意和想象力的空间,还特别适合教育、亲子互动以及个人娱乐。ColorJoyful通过提供多样化的着色页主题,满足了不同用户群体的需求,无论是儿童、成人还是教育工作者,都能在这个平台上找到合适的着色页。 AI技术 图像生成 在线平台
  • AI段落生成器:智能写作助手,一键生成段落。 AI段落生成器是一个在线工具,它使用人工智能技术根据用户输入的关键词或主题自动生成段落。这种工具对于需要快速生成文本内容的用户来说非常有用,尤其是在写作、编辑和内容创作领域。它可以帮助用户节省时间,提高写作效率,并且激发创意。产品背景信息显示,这是一个免费提供给广大用户的服务,旨在通过技术简化写作过程。 AI写作 段落生成 创意激发
  • Giga视频超级工厂:AI赋能的短视频生产平台,批量生成多样化视频内容。 Giga视频超级工厂是一款基于AI技术,融合多项智能能力的视频生产平台。它通过智能化技术和工业化生产线,实现短视频的批量生产,让创意快速变为现实。产品具备视频生视频、图文生视频、报纸生视频以及视频智能翻译等功能,适用于新闻报道、企业宣传、活动推广等多种场景,助力用户高效制作并传播视频内容。 AI视频生产 内容创作 视频编辑
  • Humanizar Texto IA:将AI生成文本转化为自然流畅的人类语言。 Humanizar Texto IA 是一款基于人工智能的文本优化工具,旨在将由AI生成的文本转化为更自然、更符合人类语言习惯的文本。该工具使用先进的算法,如基于GPT-3和自然语言处理技术,来改善文本的语法、风格、语调和连贯性。它不仅提高了文本的质量,还有助于用户避免被AI检测工具如ChatGPT Zero识别。Humanizar Texto IA 工具的主要优点包括提升文本质量、降低成本、全天候可用性和保障隐私。 文本优化 自然语言处理 AI写作辅助