亿速云旗下产品包括:
DeepSeek 在后训练阶段大规模使用了强化学习技术,在仅有极少标注数据的情况下,极大提升了模型推理能力。在数学、代码、自然语言推理等任务上
2025-12-15 更新
通义千问全新多模态理解生成大模型,支持文本 通义千问全新多模态理解生成大模型,支持文本...
通义万相是阿里巴巴通义旗下的AI创意创作平台,旨在通过人工智能技术降低创作门槛,可提供文生图、图生图、文生视频、图生视频、图像编辑等创作场景.
2025-12-25 更新
Z-Image-Turbo 在保持出色美学质量的同时,提供强大的逼真图像生成能力。 准确的双语文本渲染:Z-Image-Turbo擅长准确渲染复杂的中文和英文文本 ...
Dify 为AI 应用提供从构思、开发到部署、监控的完整基础设施,帮助你的团队打造能投产并创造真正价值的Agentic AI 解决方案。
情感可控、时长可调的工业级自回归零样本文本转语音它在情感表达和语音时长控制方面取得了关键性突破,是零样本TTS技术迈向实用化阶段的重要里程碑
2025-10-17 更新
DIT是一个基于Diffusion transformer的文本到图像生成模型,此模型具有中英文细粒度理解能力。为了构建混元DiT,精心设计了Transformer结构、文本编码器和位置编码。
2025-07-10 更新
F5-TTS是一款AI驱动的文本转语音合成工具,可将文本转换为自然的语音。它提供实时处理功能,非常适合创建动态音频内容、配音和数字叙述。
2025-07-08 更新
Whisper 是一个通用语音识别模型。它基于大量多样化音频数据集进行训练,同时也是一个多任务模型,可以执行多语言语音识别、语音翻译和语言识别。
ChatTTS是专为对话场景设计的语音生成模型,特别适用于ChatTTS是专为对话场景设计的语音生成模型,以及诸如对话式音频和视频介绍等应用。它支持中文和英文,通过使用大约100,000小时的 ...
2025-10-16 更新
CosyVoice 是一款领先的多语言、情感控制的语音生成大模型,它不仅能在多种语言和情感下生成自然的语音,还能通过简单的音频样本进行说话人声音克隆,提供精准的音色和情感调控。
2025-07-07 更新
IDM-VTON(Improved Diffusion Models for Virtual Try-ON)是由韩国研究人员提出的一种先进的AI虚拟试穿技术
支持声音驱动图片,声音驱动视频。镜像集合webUI,只需要上传你的多媒体文件即可
2025-07-03 更新
ComfyUI 是一个基于 节点式工作流 的 Stable Diffusion 交互界面,专注于为高级用户提供 高度可定制化 和 可编程 的图像生成体验
2025-07-01 更新
Ollama 是一个开源的大型语言模型(LLM)本地运行框架,专注于简化大模型在个人设备上的部署和使用体验
TensorFlow 是 Google 开发的开源机器学习框架,以其强大的生产级部署能力和灵活的架构设计著称
CUDA 具有Hopper架构全面优化、消费级显卡增强、多GPU协作等核心特性
2025-07-11 更新
Llama 3.3指令调优的纯文本模型针对多语言对话场景进行了优化,在常见的行业基准测试中,其表现优于许多可用的开源和闭源聊天模型。
Gemini 是一种多模态AI 模型,能够处理文本、图像、音频和视频,而ChatGPT 专注于生成和理解文本,主要充当会话AI
AI数字人-口型驱动-模型训练
Miniconda 是 Anaconda 的轻量级替代方案,它只包含 Conda 包管理器和 Python,具有体积小快速部署等特性
2025-07-05 更新
PyTorch 是由 Facebook AI Research (FAIR) 开发的开源深度学习框架,以其动态计算图、Python 优先设计和强大的 GPU 加速能力著称
stable-diffusion-v1.5是用stable-diffusion-v1.2 检查点的权重初始化的,并随后在 "laion-aesthetics v2 5+" 上以 512x512 的分辨率进行了595k步的微调
GPU显存:{{ spec.gpu }}GB
{{ system.name }} 请选择版本
{{ modelVersion.name }} 请选择版本
{{ appVersion.name }} 请选择版本
{{ d.badge }}
原价¥{{ amount }}
¥{{ discountAmount }}
售前业务咨询
售后技术保障
7*24小时售后电话
官方微信小程序
注:转账到上述银行账号后,需联系我司业务员或财务(联系电话:400 100 2938)确认入账。