OpenAI GPT-5.4 mini ve nano: Küçük, Hızlı, Ucuz
OpenAI, GPT-5.4 mini ve nano modellerini duyurdu. Mini model GPT-5 mini'den 2 kat hızlı, nano ise milyon token başına sadece 20 sent.
OpenAI'ın yeni modelleri her zaman en büyük olanla gelmiyor artık. Şirket bu hafta GPT-5.4 mini ve GPT-5.4 nano'yu duyurdu. Her ikisi de amiral gemisi GPT-5.4'ün yeteneklerini daha hızlı ve daha ucuz paketlere taşıyor.
GPT-5.4 mini, GPT-5 mini'ye kıyasla kodlama, muhakeme, çok modlu anlama ve araç kullanımında belirgin bir sıçrama yapıyor. Hız tarafında 2 kattan fazla hızlı çalışıyor. SWE-Bench Pro'da yüzde 54.4, Terminal-Bench 2.0'da yüzde 60.0 ve OSWorld-Verified'da yüzde 72.1 skora ulaşıyor. Bu son rakam, büyük GPT-5.4 modelinin yüzde 75.0'ına oldukça yakın.
Nano: En küçük, en ucuz
GPT-5.4 nano ise sınıflandırma, veri çıkarma ve sıralama gibi görevler için tasarlandı. Hız ve maliyet her şeyin önünde. API fiyatlandırması: 1 milyon input tokeni 0.20 dolar, output tokeni 1.25 dolar. Karşılaştırma için mini modelin fiyatı 0.75 ve 4.50 dolar.
Codex'te subagent devrimi
Asıl ilginç kullanım Codex entegrasyonunda ortaya çıkıyor. Büyük GPT-5.4 modeli planlama ve koordinasyonu üstlenirken, GPT-5.4 mini subagent olarak daha dar görevleri paralel yürütüyor: kod tabanı aramak, büyük dosyaları incelemek, destekleyici belgeleri işlemek. Mini model Codex kotasının sadece yüzde 30'unu tüketiyor, yani yaklaşık üçte bir maliyetle çalışıyor.
Bu desen, tek bir modelden her şeyi beklemek yerine farklı boyutlardaki modellerin orkestra gibi çalıştığı bir mimariyi işaret ediyor. Büyük model neyin yapılacağına karar veriyor, küçük modeller hızla uyguluyor.
ChatGPT'de GPT-5.4 mini, Free ve Go kullanıcılarına "Thinking" özelliği üzerinden sunuluyor. Diğer kullanıcılar için GPT-5.4 Thinking'in rate limit yedeklemesi olarak devreye giriyor. Nano ise şimdilik yalnızca API'de mevcut.
400K bağlam penceresi desteği, güçlü GPQA Diamond skoru (yüzde 88.0) ve düşük gecikme birleştiğinde, GPT-5.4 mini "en iyi model en büyük model değil, en hızlı yanıt veren model" argümanını güçlendiriyor. Özellikle üretim ortamlarında gecikmenin doğrudan kullanıcı deneyimini şekillendirdiği kodlama asistanları, bilgisayar kullanım sistemleri ve gerçek zamanlı çok modlu uygulamalar için ideal bir denge noktası sunuyor.