Text to VideoImage to Video

Veo 3.1

Google Veo 3.1 是由 Google DeepMind 开发的下一代 AI 视频生成模型。支持文本生成视频和图像生成视频,产出高保真、电影级视觉效果,具备先进的场景理解和自然运动模拟能力。

所有模型

68 找到的相关模型

Qwen Image 2.0

Qwen|
Text to ImageImage to Image

阿里巴巴 Qwen Image 2.0 是一款统一图像模型,支持真实感生成、结构化文字渲染、原生 2K 输出,以及跨创意和视觉设计工作流的灵活编辑。

Claude Sonnet 4.6

Anthropic|
Chat

Claude Sonnet 4.6 提供强大的推理能力、先进的编程能力和原生计算机使用功能。具有自适应思维和高达 100 万 token 的上下文窗口。

Claude Opus 4.6

Anthropic|
Chat

Claude Opus 4.6 是 Anthropic 升级的 Opus 级模型,用于编程、长上下文推理、智能体工作流和复杂知识工作。

Claude Haiku 4.5

Anthropic|
Chat

Claude Haiku 4.5 是 Anthropic 的轻量级 AI 模型,专为快速、高性价比的 AI 应用设计,在编程、聊天和自动化任务中具有接近前沿的性能。

GPT-5.4

OpenAI|
Chat

OpenAI 的 GPT-5.4 在复杂推理、编程和专业知识工作方面提供强大能力,实现更快的开发周期和更高质量的结果。

Kling 3.0 Motion Control

Kling|
Video to Video

Kling Motion Control 3.0 是快手 Kling 的 AI 视频运动模型,可将参考视频的运动转移到角色图像,同时保留面部身份和表情。

OpenAI Codex

OpenAI|
Chat

OpenAI Codex API 基于 GPT-5 Codex 模型提供先进的编程能力。支持代码生成、调试和复杂工程工作流,具有可扩展的推理深度。

Gemini 3.1 Pro

Google|
Chat

Gemini 3.1 Pro API 是 Google DeepMind 开发的最新通用大语言模型,旨在弥合高速执行与深度逻辑之间的差距。

Nano Banana 2

Google|
Text to ImageImage to Image

Nano Banana 2 是 Google 的 Gemini 3.1 Flash Image 模型。专为开发者打造,结合闪电般的速度和 Pro 级质量与可扩展的图像生成。

GPT-5.2

OpenAI|
Chat

GPT-5.2 是 OpenAI 最先进的 GPT-5 模型,用于推理、编程、长文档和专业 AI 工作流。

Coming Soon

Seedance 2.0

ByteDance|
Text to VideoImage to Video+1

Seedance 2.0 是字节跳动的多模态 AI 视频模型,能生成一致的、电影级视频,具有强大的多镜头一致性和原生音频。

Kling 3.0

Kling|
Text to VideoImage to Video+1

Kling 3.0 是 Kling AI 的视频生成模型,可从文本和图像创建视频,支持多镜头叙事,并生成具有电影控制的原生音频。