Alibaba Qwen 3.5: 397 Milyar Parametreli Açık Kaynak AI Modeli
Alibaba Qwen 3.5, 17B aktif parametreli 397B MoE modeli açık kaynak yayınlandı. 1M token bağlam, 201 dil ve multimodal yetenekler sunuyor.
Alibaba Cloud'un Qwen ekibi, yeni nesil büyük dil modeli Qwen 3.5'i açık kaynak olarak yayınladı. En güçlü versiyonu olan Qwen3.5-397B-A17B, toplam 397 milyar parametreye sahip olmasına rağmen, Mixture-of-Experts (MoE) mimarisi sayesinde herhangi bir sorguda yalnızca 17 milyar parametreyi aktif kullanıyor. Bu, devasa bir modelin zekasını, çok daha küçük bir modelin hızında sunmak demek.
Qwen 3.5, sektördeki "daha büyük model = daha yavaş" denklemini kırmayı hedefliyor. Model, klasik Transformer yerine Gated Delta Networks adlı hibrit bir mimari kullanıyor: 60 katmandan oluşan yapıda her 4 katmandan 3'ü lineer attention, 1'i standart attention kullanıyor. Sonuç olarak önceki nesle göre 8.6x ile 19x arasında hız artışı sağlanıyor. Görsel verileri de işleyebilen model, Early Fusion yöntemiyle eğitilmiş multimodal bir yapıya sahip — bir UI ekran görüntüsünden HTML/CSS kodu üretebiliyor. Plus versiyonu 1 milyon token bağlam penceresi destekliyor, 201 dil desteğiyle önceki versiyondaki 119 dilden büyük bir sıçrama yapıyor ve Model Context Protocol (MCP) ile araçlara bağlanarak fonksiyon çağrıları yapabiliyor. Her token için 512 uzmandan yalnızca 11'i devreye giriyor.
Açık kaynak AI yarışında dengeleri yeniden kuran Qwen 3.5, Meta'nın Llama serisi, Mistral ve DeepSeek'in ardından hem performans hem verimlilik açısından rekabetçi bir konumda. MoE mimarisinin bu kadar agresif kullanımı — 397B toplam ama 17B aktif — kurumsal kullanım için maliyeti dramatik şekilde düşürüyor. Benchmark sonuçları da dikkat çekici: Humanity's Last Exam'da araçsız %48.4, ARC-AGI-2'de %84.6 ve Codeforces'ta 3455 Elo. Bu skorlar, kapalı kaynak rakiplerle aynı ligde oynamak anlamına geliyor.
Açık kaynak olması ve 201 dil desteğine sahip olması, geliştiricilerin ve şirketlerin modeli kendi sunucularında çalıştırmasını, fine-tune etmesini ve özelleştirmesini mümkün kılıyor. Model ağırlıkları Hugging Face ve GitHub üzerinden erişilebilir.