{"models":[{"model_id":"dos-auto","display_name":"DOS.AI Auto","provider":"dos-ai","input_price_per_million":0,"output_price_per_million":0,"context_length":131072,"description":"Smart routing - automatically picks the best model for your request. Free for simple tasks, paid models for complex ones.","capabilities":{},"providers":[{"provider":"dos-ai","display_name":"DOS.AI (self-hosted)","retail_in":0,"retail_out":0,"context_len":131072,"data_retention":"allow","status":"enabled"}]},{"model_id":"claude-haiku-4.5","display_name":"Claude Haiku 4.5","provider":"anthropic","input_price_per_million":105,"output_price_per_million":525,"context_length":200000,"description":"Fastest and most compact Claude model","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"anthropic","display_name":"anthropic","retail_in":105,"retail_out":525,"context_len":200000,"data_retention":"allow","status":"enabled"}]},{"model_id":"wan2.7-t2v","display_name":"Wan 2.7 Text-to-Video","provider":"alibaba","input_price_per_million":10000,"output_price_per_million":0,"description":"Video generation from text prompt via Alibaba Wan 2.7. Duration 2-15s, 1080P, native audio. Pricing: per 1000 seconds.","capabilities":{},"providers":[{"provider":"alibaba","display_name":"alibaba","retail_in":10000,"retail_out":0,"data_retention":"allow","status":"enabled"}]},{"model_id":"wan2.7-i2v","display_name":"Wan 2.7 Image-to-Video","provider":"alibaba","input_price_per_million":10000,"output_price_per_million":0,"description":"Video generation from image + text prompt via Alibaba Wan 2.7. Pricing: per 1000 seconds.","capabilities":{},"providers":[{"provider":"alibaba","display_name":"alibaba","retail_in":10000,"retail_out":0,"data_retention":"allow","status":"enabled"}]},{"model_id":"minimax-music-2.5","display_name":"MiniMax Music 2.5+","provider":"minimax","input_price_per_million":5000,"output_price_per_million":0,"description":"Music generation with vocals or instrumental. ~3 min per track. Price: per 1000 seconds of audio.","capabilities":{},"providers":[{"provider":"minimax","display_name":"minimax","retail_in":5000,"retail_out":0,"data_retention":"allow","status":"enabled"}]},{"model_id":"dos-ai","display_name":"DOS.AI","provider":"dos-ai","input_price_per_million":7,"output_price_per_million":50,"context_length":131072,"description":"Ultra-efficient MoE model — 35B total, 3B active parameters. Fast inference at near-8B cost with 70B-class quality.","capabilities":{"category":"chat","is_featured":true,"is_new":true,"parameters":"35B MoE (3B active)","streaming":true,"tools":true},"providers":[{"provider":"dos-ai","display_name":"DOS.AI (self-hosted)","retail_in":7,"retail_out":50,"context_len":131072,"data_retention":"allow","status":"enabled"}]},{"model_id":"gpt-5.4-nano","display_name":"GPT-5.4 Nano","provider":"openai","input_price_per_million":21,"output_price_per_million":131,"context_length":400000,"description":"Cheapest GPT-5.4-class model for simple high-volume tasks","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"openai","display_name":"openai","retail_in":21,"retail_out":131,"context_len":400000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gpt-5.5","display_name":"GPT-5.5","provider":"openai","input_price_per_million":525,"output_price_per_million":3150,"context_length":1050000,"description":"OpenAI flagship — replaces GPT-5.4 at top tier with native reasoning","capabilities":{"category":"chat","reasoning":true,"vision":true},"providers":[{"provider":"openai","display_name":"openai","retail_in":525,"retail_out":3150,"context_len":1050000,"data_retention":"allow","status":"enabled"}]},{"model_id":"deepseek-v4-flash","display_name":"DeepSeek V4 Flash","provider":"deepseek","input_price_per_million":15,"output_price_per_million":29,"context_length":1000000,"description":"1M-context fast tier replacing DeepSeek V3","capabilities":{"category":"chat","reasoning":true},"providers":[{"provider":"deepseek","display_name":"deepseek","retail_in":15,"retail_out":29,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"deepseek-v4-pro","display_name":"DeepSeek V4 Pro","provider":"deepseek","input_price_per_million":183,"output_price_per_million":365,"context_length":1000000,"description":"Near-frontier quality at ~1/6 the cost of Opus 4.7 / GPT-5.5","capabilities":{"category":"chat","reasoning":true},"providers":[{"provider":"deepseek","display_name":"deepseek","retail_in":183,"retail_out":365,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"claude-sonnet-4.6","display_name":"Claude Sonnet 4.6","provider":"anthropic","input_price_per_million":315,"output_price_per_million":1575,"context_length":200000,"description":"Fast, intelligent model for everyday tasks","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"anthropic","display_name":"anthropic","retail_in":315,"retail_out":1575,"context_len":200000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gemini-3.1-pro","display_name":"Gemini 3.1 Pro","provider":"google","input_price_per_million":210,"output_price_per_million":1260,"context_length":1000000,"description":"Google's most advanced reasoning model for complex tasks","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"google","display_name":"google","retail_in":210,"retail_out":1260,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gemini-3.1-flash-lite","display_name":"Gemini 3.1 Flash-Lite","provider":"google","input_price_per_million":26,"output_price_per_million":158,"context_length":1000000,"description":"Fastest and most cost-efficient Gemini 3 model","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"google","display_name":"google","retail_in":26,"retail_out":158,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gemini-3.1-flash-live","display_name":"Gemini 3.1 Flash Live","provider":"google","input_price_per_million":79,"output_price_per_million":473,"context_length":1000000,"description":"Real-time voice and dialogue model","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"google","display_name":"google","retail_in":79,"retail_out":473,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"grok-4.20","display_name":"Grok 4.20","provider":"xai","input_price_per_million":210,"output_price_per_million":630,"context_length":2000000,"description":"xAI flagship reasoning model with 2M context","capabilities":{"category":"chat","reasoning":true,"vision":true},"providers":[{"provider":"xai","display_name":"xai","retail_in":210,"retail_out":630,"context_len":2000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"claude-opus-4.8","display_name":"Claude Opus 4.8","provider":"anthropic","input_price_per_million":525,"output_price_per_million":2625,"context_length":1000000,"capabilities":{"category":"chat","reasoning":true,"vision":true},"providers":[{"provider":"anthropic","display_name":"anthropic","retail_in":525,"retail_out":2625,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gemini-3.5-flash","display_name":"Gemini 3.5 Flash","provider":"google","input_price_per_million":158,"output_price_per_million":945,"context_length":1000000,"description":"Latest Gemini Flash - frontier performance, standard tier","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"google","display_name":"google","retail_in":158,"retail_out":945,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"qwen3.7-max","display_name":"Qwen 3.7 Max","provider":"qwen","input_price_per_million":263,"output_price_per_million":788,"context_length":1000000,"description":"Qwen 3.7 Max tier - 1M context (standard price; OpenRouter shows a 50%-off promo)","capabilities":{"category":"chat","reasoning":true},"providers":[{"provider":"qwen","display_name":"qwen","retail_in":263,"retail_out":788,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"qwen3.7-plus","display_name":"Qwen 3.7 Plus","provider":"qwen","input_price_per_million":42,"output_price_per_million":168,"context_length":1000000,"description":"Qwen 3.7 Plus - multimodal (text+image), 1M context","capabilities":{"category":"chat","reasoning":true,"vision":true},"providers":[{"provider":"qwen","display_name":"qwen","retail_in":42,"retail_out":168,"context_len":1000000,"data_retention":"allow","status":"enabled"}]},{"model_id":"gpt-5.4-mini","display_name":"GPT-5.4 Mini","provider":"openai","input_price_per_million":79,"output_price_per_million":473,"context_length":400000,"description":"Strong mini model for coding, computer use, and sub-agents","capabilities":{"category":"chat","vision":true},"providers":[{"provider":"openai","display_name":"openai","retail_in":79,"retail_out":473,"context_len":400000,"data_retention":"allow","status":"enabled"}]},{"model_id":"grok-4.3","display_name":"Grok 4.3","provider":"xai","input_price_per_million":131,"output_price_per_million":263,"context_length":1000000,"description":"xAI flagship reasoning model - 1M context, text+image (replaces grok-4.1-fast)","capabilities":{"category":"chat","reasoning":true,"vision":true},"providers":[{"provider":"xai","display_name":"xai","retail_in":131,"retail_out":263,"context_len":1000000,"data_retention":"allow","status":"enabled"}]}]}