Models — Miavo

97 of 97 models · 31 available · 70 coming soon

Claude Opus 4.8

2 provider routesAvailable

sandbase-claude-opus-4-8

Claude Opus 4.8 through SandBase OpenAI-compatible routing. 1M context, 128k output.

SandBasesandbase-claude-opus-4-8$5.00 / $25.00

Amazon Bedrockbedrock-claude-opus-4-8$5.00 / $25.00

In / MTok

from $5.00

Out / MTok

from $25.00

Context

1,000k

StreamingToolsImage input

Gemini 2.5 Flash TTS

Available

gemini-2.5-flash-tts

Cheaper prior-gen TTS — same controllability, narrower language set.

Google AI Studiogemini-2.5-flash-tts$0.00

Per unit

$0.00

Provider

Google AI Studio

Async

Streaming

Gemini 3 Flash

Available

gemini-3-flash

Mid-tier multimodal. Image + video + text input. 1M context.

Google AI Studiogemini-3-flash$0.50 / $3.00

In / MTok

$0.50

Out / MTok

$3.00

Context

1,000k

StreamingToolsImage input

Gemini 3.1 Flash Live

Available

gemini-3.1-flash-live

Realtime conversational audio — bidirectional, sub-second latency. ~$0.005/min in, $0.018/min out.

Google AI Studiogemini-3.1-flash-live$0.00

Per unit

$0.00

Provider

Google AI Studio

Async

StreamingTools

Gemini 3.1 Flash TTS

Available

gemini-3.1-flash-tts

Controllable TTS across 70+ languages, 200+ inline emotion tags. Audio output tokens.

Google AI Studiogemini-3.1-flash-tts$0.00

Per unit

$0.00

Provider

Google AI Studio

Async

Streaming

Gemini 3.1 Flash-Lite

Available

gemini-3.1-flash-lite

Cheapest 1M-context tier. Great for high-volume agents.

Google AI Studiogemini-3.1-flash-lite$0.25 / $1.50

In / MTok

$0.25

Out / MTok

$1.50

Context

1,000k

StreamingToolsImage input

Gemini 3.1 Pro

2 provider routesAvailable

gemini-3.1-pro

Google’s flagship reasoning model + Computer Use. 1M context.

Google AI Studiogemini-3.1-pro$2.00 / $12.00

Google Vertexvertex-gemini-3.1-pro$2.00 / $12.00

In / MTok

from $2.00

Out / MTok

from $12.00

Context

1,000k

StreamingToolsImage input

Gemini 3.5 Flash

Available

gemini-3.5-flash

Stable Gemini 3.5 model built for fast frontier intelligence, agents, coding, and grounding.

Google AI Studiogemini-3.5-flash$1.50 / $9.00

In / MTok

$1.50

Out / MTok

$9.00

Context

1,000k

StreamingToolsImage input

Gemini 3.5 Flash-Lite

Available

gemini-3.5-flash-lite

Google’s current low-cost GA model for high-volume multimodal workloads. 1M context.

Google AI Studiogemini-3.5-flash-lite$0.30 / $2.50

In / MTok

$0.30

Out / MTok

$2.50

Context

1,000k

StreamingToolsImage input

Gemini 3.6 Flash

Available

gemini-3.6-flash

Google’s current GA Flash model for fast multimodal reasoning, coding, and agents. 1M context.

Google AI Studiogemini-3.6-flash$1.50 / $7.50

In / MTok

$1.50

Out / MTok

$7.50

Context

1,000k

StreamingToolsImage input

Gemini Omni Flash

Available

gemini-omni-flash

Gemini Omni Flash preview — fast 3–10 second 720p video with audio via the Interactions API.

Google AI Studiogemini-omni-flash$0.10

per second

$0.10

Provider

Google AI Studio

Async

Yes

Image input

Nano Banana

Available

nano-banana

Original Nano Banana (Gemini 2.5 Flash Image). Fast, fun edits.

Google AI Studionano-banana$0.039

per image

$0.039

Provider

Google AI Studio

Async

Nano Banana 2

Available

nano-banana-2

Nano Banana 2 (Gemini 3.1 Flash Image) — Pro features at Flash speed. $0.067/1K, $0.10/2K, $0.15/4K.

Google AI Studionano-banana-2$0.067

per image

$0.067

Provider

Google AI Studio

Async

Nano Banana 2 Lite

Available

nano-banana-2-lite

Nano Banana 2 Lite (Gemini 3.1 Flash-Lite Image) — low-latency 1K image generation and editing.

Google AI Studionano-banana-2-lite$0.034

per image

$0.034

Provider

Google AI Studio

Async

Nano Banana Pro

Available

nano-banana-pro

Nano Banana Pro (Gemini 3 Pro Image) — best fidelity, complex prompts, accurate text. $0.134/1K-2K, $0.24/4K.

Google AI Studionano-banana-pro$0.134

per image

$0.134

Provider

Google AI Studio

Async

Veo 3.1

2 provider routesAvailable

veo-3.1

Cinematic text/image-to-video, 720p–1080p, optional audio.

Google AI Studioveo-3.1$0.40

Google Vertexvertex-veo-3.1$0.40

per second

$0.40

Provider

Google AI Studio

Async

Yes

Veo 3.1 Fast

2 provider routesAvailable

veo-3.1-fast

Veo 3.1 Fast — $0.10/s @720p, $0.12/s @1080p, $0.30/s @4K.

Google AI Studioveo-3.1-fast$0.10

Google Vertexvertex-veo-3.1-fast$0.10

per second

$0.10

Provider

Google AI Studio

Async

Yes

Claude Haiku 4.5

Available

bedrock-claude-haiku-4-5

Claude Haiku 4.5 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-haiku-4-5$1.00 / $5.00

In / MTok

$1.00

Out / MTok

$5.00

Context

200k

StreamingToolsImage input

Claude Opus 4.1

Available

bedrock-claude-opus-4-1-us-cr

Claude Opus 4.1 through AWS Bedrock US cross-region profile. Includes the documented 10% premium.

Amazon Bedrockbedrock-claude-opus-4-1-us-cr$5.50 / $27.50

In / MTok

$5.50

Out / MTok

$27.50

Context

1,000k

StreamingToolsImage input

Claude Opus 4.5

Available

bedrock-claude-opus-4-5

Claude Opus 4.5 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-opus-4-5$5.00 / $25.00

In / MTok

$5.00

Out / MTok

$25.00

Context

1,000k

StreamingToolsImage input

Claude Opus 4.6

Available

bedrock-claude-opus-4-6

Claude Opus 4.6 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-opus-4-6$5.00 / $25.00

In / MTok

$5.00

Out / MTok

$25.00

Context

1,000k

StreamingToolsImage input

Claude Opus 4.7

Available

bedrock-claude-opus-4-7

Claude Opus 4.7 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-opus-4-7$5.00 / $25.00

In / MTok

$5.00

Out / MTok

$25.00

Context

1,000k

StreamingToolsImage input

Claude Sonnet 4.5

Available

bedrock-claude-sonnet-4-5

Claude Sonnet 4.5 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-sonnet-4-5$3.00 / $15.00

In / MTok

$3.00

Out / MTok

$15.00

Context

1,000k

StreamingToolsImage input

Claude Sonnet 4.6

Available

bedrock-claude-sonnet-4-6

Claude Sonnet 4.6 through AWS Bedrock Global application inference profile.

Amazon Bedrockbedrock-claude-sonnet-4-6$3.00 / $15.00

In / MTok

$3.00

Out / MTok

$15.00

Context

1,000k

StreamingToolsImage input

Chirp 3

Available

vertex-chirp-3

TTS with Instant Custom Voice (10s reference audio).

Google Vertexvertex-chirp-3$16.00

per 1M chars

$16.00

Provider

Google Vertex

Async

Streaming

Imagen 3

Available

vertex-imagen-3

Highest-quality Imagen text-to-image with inpainting + editing.

Google Vertexvertex-imagen-3$0.040

per image

$0.040

Provider

Google Vertex

Async

Lyria 3 Pro

Available

vertex-lyria-3-pro

Music generation up to 184s. Public preview.

Google Vertexvertex-lyria-3-pro$0.06

per second

$0.06

Provider

Google Vertex

Async

Claude Fable 5

Coming soon

claude-fable-5

Claude Fable 5. Highest quality long-context Claude tier with a data-use notice required before playground use.

Anthropicclaude-fable-5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

Claude Sonnet 5

Coming soon

claude-sonnet-5

Anthropic’s current balanced frontier model. 1M context, 128k output.

Anthropicclaude-sonnet-5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

GPT Image 2

Coming soon

gpt-image-2

OpenAI image gen — flexible sizes, high-fidelity image input.

OpenAIgpt-image-2-Coming soon

per image

Coming soon

Provider

OpenAI

Async

GPT Realtime

Coming soon

gpt-realtime

Bidirectional voice + text. ~$0.06/min audio in, $0.24/min audio out. Text in/out at $5/$20.

OpenAIgpt-realtime-Coming soon

Per unit

Coming soon

Provider

OpenAI

Async

StreamingTools

GPT-4o Audio

Coming soon

gpt-4o-audio-preview

Text-or-audio in, text-or-audio out via /v1/chat/completions.

OpenAIgpt-4o-audio-preview-Coming soon

Per unit

Coming soon

Provider

OpenAI

Async

StreamingTools

GPT-4o mini TTS

Coming soon

gpt-4o-mini-tts

Token-priced TTS — ~$0.015/min generated audio.

OpenAIgpt-4o-mini-tts-Coming soon

Per unit

Coming soon

Provider

OpenAI

Async

StreamingTools

GPT-4o Transcribe

Coming soon

gpt-4o-transcribe

ASR with optional speaker diarization. Same price as Whisper.

OpenAIgpt-4o-transcribe-Coming soon

per minute

Coming soon

Provider

OpenAI

Async

Streaming

GPT-5.4

Coming soon

gpt-5.4

March 2026 release — sits between mini and 5.5. Strong cost/intel ratio.

OpenAIgpt-5.4-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

GPT-5.4 mini

Coming soon

gpt-5.4-mini

GPT-5.4-class capability, fast + efficient. 400k context.

OpenAIgpt-5.4-mini-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

400k

StreamingToolsImage input

GPT-5.4 nano

Coming soon

gpt-5.4-nano

OpenAI’s smallest, cheapest model. High-volume simple tasks.

OpenAIgpt-5.4-nano-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

400k

StreamingToolsImage input

GPT-5.5

Coming soon

gpt-5.5

Flagship multimodal. 1M context. Computer use, MCP, hosted shell.

OpenAIgpt-5.5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

GPT-5.5 Pro

Coming soon

gpt-5.5-pro

Highest-tier flagship — research-grade reasoning. No cached-input discount.

OpenAIgpt-5.5-pro-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

GPT-5.6 Luna

Coming soon

gpt-5.6-luna

Efficient GPT-5.6 tier for high-volume workloads. 1.05M context, 128k output.

OpenAIgpt-5.6-luna-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,050k

StreamingToolsImage input

GPT-5.6 Sol

Coming soon

gpt-5.6-sol

OpenAI’s current flagship for complex professional reasoning and coding. 1.05M context, 128k output.

OpenAIgpt-5.6-sol-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,050k

StreamingToolsImage input

GPT-5.6 Terra

Coming soon

gpt-5.6-terra

Balanced GPT-5.6 tier with frontier capability at lower cost. 1.05M context, 128k output.

OpenAIgpt-5.6-terra-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,050k

StreamingToolsImage input

o4-mini

Coming soon

o4-mini

Cheap reasoning model — math, code, structured analysis at low cost.

OpenAIo4-mini-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

Text Embedding 3 Large

Coming soon

text-embedding-3-large

OpenAI large embedding model with higher retrieval quality.

OpenAItext-embedding-3-large-Coming soon

Per unit

Coming soon

Provider

OpenAI

Async

Text Embedding 3 Small

Coming soon

text-embedding-3-small

OpenAI small embedding model for semantic search and clustering.

OpenAItext-embedding-3-small-Coming soon

Per unit

Coming soon

Provider

OpenAI

Async

TTS-1

Coming soon

tts-1

Standard TTS — same voices, lower fidelity, half the cost of HD.

OpenAItts-1-Coming soon

per 1M chars

Coming soon

Provider

OpenAI

Async

Streaming

TTS-1 HD

Coming soon

tts-1-hd

High-fidelity TTS — 6 preset voices. /v1/audio/speech endpoint.

OpenAItts-1-hd-Coming soon

per 1M chars

Coming soon

Provider

OpenAI

Async

Streaming

Whisper (legacy)

Coming soon

whisper-1

Speech-to-text (ASR). Will be superseded by gpt-4o-transcribe.

OpenAIwhisper-1-Coming soon

per minute

Coming soon

Provider

OpenAI

Async

MiniMax Hailuo 2.3

Coming soon

minimax-hailuo-2.3

Latest Hailuo text-to-video. Billed in units; ~$0.04/s @768p.

MiniMaxminimax-hailuo-2.3-Coming soon

per second

Coming soon

Provider

MiniMax

Async

Yes

MiniMax Hailuo 2.3 Fast

Coming soon

minimax-hailuo-2.3-fast

Hailuo 2.3 Fast — 30% cheaper than 2.3, same family.

MiniMaxminimax-hailuo-2.3-fast-Coming soon

per second

Coming soon

Provider

MiniMax

Async

Yes

MiniMax Image 01

Coming soon

minimax-image-01

Text-to-image, photoreal + stylized.

MiniMaxminimax-image-01-Coming soon

per image

Coming soon

Provider

MiniMax

Async

MiniMax M2.1

Coming soon

minimax-m2.1

Older M-series — kept for reproducibility.

MiniMaxminimax-m2.1-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

MiniMax M2.5

Coming soon

minimax-m2.5

Prior-gen M-series — same base price, slightly weaker quality.

MiniMaxminimax-m2.5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

MiniMax M2.7

Coming soon

minimax-m2.7

MiniMax’s newest self-iterating flagship for code + agents.

MiniMaxminimax-m2.7-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

MiniMax M2.7 Highspeed

Coming soon

minimax-m2.7-highspeed

M2.7 with priority routing — 2× cost for lower TTFT.

MiniMaxminimax-m2.7-highspeed-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

MiniMax Music 1.5

Coming soon

minimax-music-1.5

Music generation from prompt — vocals + instrumentation.

MiniMaxminimax-music-1.5-Coming soon

per track

Coming soon

Provider

MiniMax

Async

MiniMax Speech 02 HD

Coming soon

minimax-speech-02-hd

Prior-gen HD voice — kept for reproducibility of pipelines.

MiniMaxminimax-speech-02-hd-Coming soon

per 1M chars

Coming soon

Provider

MiniMax

Async

Streaming

MiniMax Speech 2.5 Turbo

Coming soon

minimax-speech-2.5-turbo

HD TTS — 40 languages, accurate voice replication.

MiniMaxminimax-speech-2.5-turbo-Coming soon

per 1M chars

Coming soon

Provider

MiniMax

Async

Streaming

MiniMax Speech 2.6

Coming soon

minimax-speech-2.6

Latest TTS — Fluent LoRA voice cloning, prosodic naturalness across 40+ languages.

MiniMaxminimax-speech-2.6-Coming soon

per 1M chars

Coming soon

Provider

MiniMax

Async

Streaming

Kimi K2 0711

Coming soon

kimi-k2-0711-preview

July 2025 K2 preview snapshot — scheduled for discontinuation 2026-05-25. (Not currently listed on OpenRouter — keeping prior estimate.)

Moonshot Kimikimi-k2-0711-preview-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingTools

Kimi K2 0905

Coming soon

kimi-k2-0905-preview

September 2025 K2 preview snapshot — scheduled for discontinuation 2026-05-25.

Moonshot Kimikimi-k2-0905-preview-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingTools

Kimi K2 Thinking

Coming soon

kimi-k2-thinking

Explicit thinking-mode K2 — chain-of-thought reasoning for math + code.

Moonshot Kimikimi-k2-thinking-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingTools

Kimi K2 Turbo

Coming soon

kimi-k2-turbo

Moonshot’s agentic K2 with priority routing — fast TTFT, 128k context.

Moonshot Kimikimi-k2-turbo-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingToolsImage input

Kimi K2.5

Coming soon

kimi-k2.5

January 2026 multimodal release — cheaper than K2.6 with similar capability.

Moonshot Kimikimi-k2.5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingToolsImage input

Kimi K2.6

Coming soon

kimi-k2.6

Moonshot’s April 2026 flagship — multimodal, 256k context.

Moonshot Kimikimi-k2.6-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingToolsImage input

Kimi Latest

Coming soon

kimi-latest

Auto-routes to Moonshot’s current default (K2.6 as of 2026-05). Multimodal.

Moonshot Kimikimi-latest-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingToolsImage input

Moonshot v1 128k

Coming soon

moonshot-v1-128k

Legacy text-only Moonshot v1 long-context. (Not on OpenRouter — keeping prior flat pricing.)

Moonshot Kimimoonshot-v1-128k-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingTools

DeepSeek Chat (legacy)

Coming soon

deepseek-chat

Legacy alias → V4 Flash non-thinking mode. Sunsets 2026-07-24; migrate to deepseek-v4-flash.

DeepSeekdeepseek-chat-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

163.84k

StreamingTools

DeepSeek Reasoner (legacy)

Coming soon

deepseek-reasoner

Legacy alias → V4 Flash thinking mode. Sunsets 2026-07-24; migrate to deepseek-v4-flash with reasoning. (Not separately listed on OpenRouter — mirrors v4-flash.)

DeepSeekdeepseek-reasoner-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingTools

DeepSeek V4 Flash

Coming soon

deepseek-v4-flash

V4 default — 1M context, 384k max output.

DeepSeekdeepseek-v4-flash-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingTools

DeepSeek V4 Pro

Coming soon

deepseek-v4-pro

V4 flagship reasoning — 1M context. OR pricing reflects 75%-off promo through 2026-05-31.

DeepSeekdeepseek-v4-pro-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingTools

CogVideoX

Coming soon

cogvideox

Zhipu’s text/image-to-video — 6s clips at 720p–1080p.

Zhipu GLMcogvideox-Coming soon

per second

Coming soon

Provider

Zhipu GLM

Async

Yes

CogVideoX Flash

Coming soon

cogvideox-flash

Free video generation tier.

Zhipu GLMcogvideox-flash-Coming soon

per second (free)

Coming soon

Provider

Zhipu GLM

Async

Yes

CogView 3 Flash

Coming soon

cogview-3-flash

Free image generation tier — generous rate limits.

Zhipu GLMcogview-3-flash-Coming soon

per image (free)

Coming soon

Provider

Zhipu GLM

Async

CogView 4

Coming soon

cogview-4

Latest text-to-image — strong on Chinese text rendering + complex prompts.

Zhipu GLMcogview-4-Coming soon

per image

Coming soon

Provider

Zhipu GLM

Async

GLM 4 AirX

Coming soon

glm-4-airx

Low-latency AirX variant — fastest GLM tier, smaller context.

Zhipu GLMglm-4-airx-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

StreamingTools

GLM 4 Flash

Coming soon

glm-4-flash

Free tier — high-volume, simple tasks. Generous rate limits.

Zhipu GLMglm-4-flash-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingTools

GLM 4.6

Coming soon

glm-4.6

GLM 4 family flagship — 200k context, agentic + coding focused.

Zhipu GLMglm-4.6-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 4.6V

Coming soon

glm-4.6v

GLM 4.6 vision variant — multimodal input on the 4-family flagship.

Zhipu GLMglm-4.6v-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingToolsImage input

GLM 4.7

Coming soon

glm-4.7

Previous-gen flagship before GLM 5 — solid coding + reasoning at lower cost.

Zhipu GLMglm-4.7-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 4.7 Flash

Coming soon

glm-4.7-flash

Lowest tier — high-volume simple tasks. Generous rate limits.

Zhipu GLMglm-4.7-flash-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 5

Coming soon

glm-5

GLM 5 base flagship — released 2026-02-12, available on Pro and Max coding tiers.

Zhipu GLMglm-5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 5 Turbo

Coming soon

glm-5-turbo

March 2026 turbo variant — priority routing on the GLM 5 family.

Zhipu GLMglm-5-turbo-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 5.1

Coming soon

glm-5.1

Zhipu’s April 2026 flagship — SOTA on SWE-Bench Pro, 200k context, 128k max output.

Zhipu GLMglm-5.1-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingTools

GLM 5V Turbo

Coming soon

glm-5v-turbo

GLM 5 family vision-capable turbo — multimodal with priority routing.

Zhipu GLMglm-5v-turbo-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

200k

StreamingToolsImage input

GLM Realtime

Coming soon

glm-realtime

End-to-end voice + video understanding with singing + 2-min memory. Function calls supported.

Zhipu GLMglm-realtime-Coming soon

Per unit

Coming soon

Provider

Zhipu GLM

Async

StreamingToolsImage input

GLM TTS

Coming soon

glm-tts

Controllable + emotion-expressive zero-shot voice cloning. Open-sourced Dec 2025.

Zhipu GLMglm-tts-Coming soon

per 1M chars

Coming soon

Provider

Zhipu GLM

Async

Streaming

Grok 4.1 Fast

Coming soon

grok-4.1-fast

Budget-friendly Grok — low TTFT, very cheap for high-volume tasks.

xAIgrok-4.1-fast-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingTools

Grok 4.20

Coming soon

grok-4.20

Long-context variant — 2M context window for very large corpora.

xAIgrok-4.20-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

2,000k

StreamingToolsImage input

Grok 4.3

Coming soon

grok-4.3

xAI’s May 2026 flagship — 1M context, multimodal.

xAIgrok-4.3-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

1,000k

StreamingToolsImage input

Qwen3 ASR Flash

Coming soon

qwen3-asr-flash

Speech-to-text — multilingual, low-latency.

Alibabaqwen3-asr-flash-Coming soon

per minute

Coming soon

Provider

Alibaba

Async

Streaming

Qwen3 Max

Coming soon

qwen3-max

Flagship Qwen3 — Alibaba’s largest dense + MoE model.

Alibabaqwen3-max-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingToolsImage input

Qwen3 Omni Flash

Coming soon

qwen3-omni-flash

Omni-modal: text + image + audio in/out. Cheapest realtime-class tier.

Alibabaqwen3-omni-flash-Coming soon

Per unit

Coming soon

Provider

Alibaba

Async

StreamingToolsImage input

Qwen3 VL Plus

Coming soon

qwen3-vl-plus

Vision-language flagship — strong OCR, document QA, GUI grounding.

Alibabaqwen3-vl-plus-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

128k

StreamingToolsImage input

Qwen3.5

Coming soon

qwen3.5

Feb 2026 release — 397B params, 201 languages, 19× faster than prior gen.

Alibabaqwen3.5-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

256k

StreamingTools

Qwen3.5 0.8B

Coming soon

qwen3.5-0.8b

Tiniest Qwen — extreme high-volume / on-device fallback.

Alibabaqwen3.5-0.8b-Coming soon

In / MTok

Coming soon

Out / MTok

Coming soon

Context

32k

StreamingTools

Cohere Rerank v3.5

Coming soon

cohere-rerank-v3.5

Cohere reranker for search and retrieval ordering via /v1/rerank.

Coherecohere-rerank-v3.5-Coming soon

per 1k searches

Coming soon

Provider

Cohere

Async

97 models across 13 providers.

Claude Opus 4.8

Gemini 2.5 Flash TTS

Gemini 3 Flash

Gemini 3.1 Flash Live

Gemini 3.1 Flash TTS

Gemini 3.1 Flash-Lite

Gemini 3.1 Pro

Gemini 3.5 Flash

Gemini 3.5 Flash-Lite

Gemini 3.6 Flash

Gemini Omni Flash

Nano Banana

Nano Banana 2

Nano Banana 2 Lite

Nano Banana Pro

Veo 3.1

Veo 3.1 Fast

Claude Haiku 4.5

Claude Opus 4.1

Claude Opus 4.5

Claude Opus 4.6

Claude Opus 4.7

Claude Sonnet 4.5

Claude Sonnet 4.6

Chirp 3

Imagen 3

Lyria 3 Pro

Claude Fable 5

Claude Sonnet 5

GPT Image 2

GPT Realtime

GPT-4o Audio

GPT-4o mini TTS

GPT-4o Transcribe

GPT-5.4

GPT-5.4 mini

GPT-5.4 nano

GPT-5.5

GPT-5.5 Pro

GPT-5.6 Luna

GPT-5.6 Sol

GPT-5.6 Terra

o4-mini

Text Embedding 3 Large

Text Embedding 3 Small

TTS-1

TTS-1 HD

Whisper (legacy)

MiniMax Hailuo 2.3

MiniMax Hailuo 2.3 Fast

MiniMax Image 01

MiniMax M2.1

MiniMax M2.5

MiniMax M2.7

MiniMax M2.7 Highspeed

MiniMax Music 1.5

MiniMax Speech 02 HD

MiniMax Speech 2.5 Turbo

MiniMax Speech 2.6

Kimi K2 0711

Kimi K2 0905

Kimi K2 Thinking

Kimi K2 Turbo

Kimi K2.5

Kimi K2.6

Kimi Latest

Moonshot v1 128k

DeepSeek Chat (legacy)

DeepSeek Reasoner (legacy)

DeepSeek V4 Flash

DeepSeek V4 Pro

CogVideoX

CogVideoX Flash

CogView 3 Flash

CogView 4

GLM 4 AirX

GLM 4 Flash

GLM 4.6

GLM 4.6V