v16.0.0•November 2, 2025

Flagship Model Expansion & Responses API Launch

SreeAuthor

This milestone update delivers one of our most significant platform upgrades, introducing the latest flagship models from leading AI research labs, expanding capabilities with advanced audio and image processing, and launching a purpose-built API for agentic workflows.

GPT-5 Family - Next-Generation Flagship Models

Pro Tier Models: Advanced flagship models with vision, reasoning, and function calling capabilities
- Core Models:
- Dated Variants:
  - provider-5/gpt-5-2025-08-07
  - provider-5/gpt-5-mini-2025-08-07
Ultra Tier Exclusive: Premium flagship model
- provider-5/gpt-5-pro
Basic Tier Models: Accessible nano variants
- Core Model:
  - provider-5/gpt-5-nano
- Dated Variant:
  - provider-5/gpt-5-nano-2025-08-07

GPT-4o Family - Enhanced Multimodal Models

Pro Tier Models: Advanced multimodal models with vision and function calling
- Core Model:
  - provider-5/gpt-4o
- Dated Variants:
Basic Tier Models: Efficient mini variants
- Core Models:
  - provider-5/gpt-4o-mini
  - provider-5/chatgpt-4o-latest
- Dated Variant:
  - provider-5/gpt-4o-mini-2024-07-18

GPT-4.1 Family - Advanced Vision & Function Calling

Basic Tier Models: Core GPT-4.1 models with enhanced capabilities
- Core Models:
  - provider-5/gpt-4.1
  - provider-5/gpt-4.1-nano
- Dated Variants:
  - provider-5/gpt-4.1-2025-04-14
  - provider-5/gpt-4.1-nano-2025-04-14
Pro Tier Models: Mini variant for optimized performance
- Core Model:
  - provider-5/gpt-4.1-mini
- Dated Variant:
  - provider-5/gpt-4.1-mini-2025-04-14

Reasoning-Focused O-Series Models

Pro Tier Models: Advanced reasoning capabilities
- Core Models:
  - provider-5/o3
  - provider-5/o4-mini
- Dated Variants:
  - provider-5/o3-2025-04-16
  - provider-5/o4-mini-2025-04-16
Basic Tier Models: Accessible mini reasoning variant
- Core Model:
  - provider-5/o3-mini
- Dated Variant:
  - provider-5/o3-mini-2025-01-31

GPT-3.5 Family - Cost-Effective Chat Models

Free Tier Models: Accessible chat models for all users
- Core Models:
  - provider-5/gpt-3.5-turbo
  - provider-5/gpt-3.5-turbo-instruct
- Dated Variants:
Pro Tier Models: Extended context variant
- provider-5/gpt-3.5-turbo-16k

Specialized Models

Ultra Tier Exclusive: Advanced coding specialist optimized for /v1/responses endpoint
- provider-5/gpt-5-codex
Free Tier Models: Text embedding capabilities
- provider-5/text-embedding-ada-002
Moderation Models: Content moderation capabilities (currently disabled)
- provider-5/omni-moderation-latest
- provider-5/omni-moderation-2024-09-26

Additional Platform Updates

Claude 4.5 Integration: Added Anthropic's latest Claude models to Provider 1 and Provider 3
Meta Llama 4 Models: Integrated to Provider 1
Qwen3 Advanced Series: Added to Provider 1
- qwen3-coder-480b-a35b-instruct-fp8
- qwen3-next-80b-a3b-thinking
- Additional Qwen3 variants
Advanced Image Editing: Added to Provider 3
- flux-kontext-max - Black Forest Labs for context-aware image editing and intelligent inpainting
Stability AI Latest: Integrated to Provider 3 for high-quality image generation
- sd-3.5-large
- sd-3.5-medium

Provider 1 Updates

Catalog Refocus: Complete restructuring to exclusively feature premium, enterprise-grade models from tier-1 AI labs. Retired open-source and community-tuned models for curated, production-ready catalog.
Mistral AI Models: Added mistral-large-latest, codestral-latest, and pixtral-large-latest with multimodal capabilities.
GPT-4.1 Family: Integrated complete GPT-4.1 series with improved instruction following and enhanced reasoning across various model sizes.
OpenAI Open-Source: Added gpt-oss-120b, OpenAI's 120B parameter open-source model for research and development.
DeepSeek Models: Integrated deepseek-v3.2-exp experimental variant and deepseek-r1-0528 reasoning-optimized model.
Zhipu AI Integration: Added glm-4.6 with enhanced multilingual capabilities and improved reasoning performance.
Production Validation: All models validated for production workloads with established SLAs, comprehensive documentation, and dedicated support.

Provider 3 Updates

Model Graduation: Promoted qwen-3-max-preview to production-ready qwen-3-max with full SLA guarantees and enterprise support.
Legacy Retirement: Removed legacy models to streamline catalog:
- ideogram-v3
- grok-4-fast
- Note: Sonar series models remain available and active
Enhanced Reliability: Improved uptime guarantees, reduced latency, and enhanced error handling for production deployments.
Multi-Modal Support: Comprehensive support for text generation, image creation, image editing, and multimodal tasks.
Performance Optimization: Improved request routing, enhanced caching strategies, and optimized model loading for reduced cold-start times.

Provider 5 Updates

Strategic Refocus: Reimagined as dedicated channel for direct OpenAI and Midjourney integrations with comprehensive, version-pinned catalogs.
Streamlined Scope: Removed all xAI (Grok) and Anthropic (Claude) models to focus exclusively on OpenAI and Midjourney offerings.
Complete GPT Coverage: Full deployment including gpt-3.5-turbo, gpt-4-turbo, gpt-4o, and entire gpt-5 family with version-pinned variants.
Image Generation: Added dall-e-2 and dall-e-3 for text-to-image generation.
Embedding Support: Deployed text-embedding-ada-002 for semantic search, document similarity, and RAG applications.
Direct API Benefits: Lowest latency, highest reliability, and most comprehensive feature support through direct API integration.

Provider 7 Updates

Latest Claude Variant: Added claude-haiku-4-5-20251001 with improved speed, enhanced reasoning, and optimized cost-efficiency, available exclusively for Ultra plan subscribers.

Plan Availability Changes

Provider 3 Pro & Ultra Exclusive: deepseek-r1-0528, deepseek-v3, o3-mini, o4-mini, gpt-4o, gpt-4.1, qwen-3-max now require Pro or Ultra subscription.
Provider 3 Basic Requirement: gpt-4o-mini and gpt-4.1-nano moved from Free tier to Basic tier and above.
Provider 5 Midjourney Exclusive: midjourney-v7 now exclusively available to Pro and Ultra subscribers.
Provider 5 Premium Tiers: High-performance models like gpt-5 and o3 available on Pro and Ultra plans.
Universal Access Models: gpt-4o-mini and gpt-5-nano remain available across all tiers including Free.

Improvements

Enhanced Model Routing: Intelligent request routing across providers based on availability, load, and performance for optimal response times.
Improved Error Handling: Comprehensive error handling with detailed messages, automatic retry logic, and graceful degradation.
Performance Optimization: Provider-level optimizations including connection pooling, request batching, and intelligent caching for reduced latency.
Dashboard Redesign: Completely redesigned dashboard with compact, professional layout featuring improved information density, optimized spacing, and enhanced visual hierarchy for better user experience.
Documentation Updates: Complete documentation refresh covering all new models, capabilities, and API endpoints with examples and migration guides.
Responses API Documentation: Added comprehensive documentation page for the new /v1/responses endpoint with detailed request/response examples, parameter descriptions, and usage guidelines.