Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba’nın Yeni Hibrit Yapay Zeka Modeli Qwen3 Tanıtıldı




Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü duyurdu. Şirketin “hibrit” yapısıyla öne çıkan bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modelleriyle yarışıyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere karşı güçlü performans

Qwen3 ailesi, 235 milyardan 600 milyon parametre sayısına kadar değişen çeşitli modellerden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini etkileyen önemli bir ölçüttür. Alibaba’ya göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini bazı karşılaştırmalarda geride bırakıyor. Qwen3 modelleri, OpenAI’nin o3 ve o4-mini gibi en üst düzey yeni modellere üstün gelmiyor, ancak yine de güçlü bir performans sergiliyorlar.

Ancak en güçlü model henüz kamuya açık değil. Bunun yerine, Qwen3-32B gibi daha küçük ancak yine de etkileyici performans gösteren modeller Hugging Face ve GitHub üzerinden indirilebilir durumda. Qwen3 modellerine ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcıları aracılığıyla da erişilebilmektedir.

Hibrit yaklaşım benimseniyor




Qwen3 modellerinin en dikkat çekici özelliklerinden biri olan “hibrit” yapısı, modelin karmaşık sorunlara karşı düşünme süreci uygulamasını ve basit sorulara hızlı cevap vermesini sağlar; yani model, gerektiğinde düşünür. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebilir. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak adlandırıyor. Bu tür çözümleri yakın zamanda görmeye başladık.

Ayrıca, bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellere dağıtır, böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerler.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dilde destek sağladığını ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri bulunmaktadır. Bu geniş veri havuzu sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü performans sergilemektedir. Örneğin, LiveCodeBench gibi yazılım karşılaştırmalarında OpenAI’ın o1 modelini geride bırakmayı başarmaktadır. Alibaba, Qwen3’ün araç çağırma yeteneğinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu belirtiyor.

Related Posts

NASA’dan Mars’ta her şeyi değiştiren keşif!

NASA’nın Mars keşif aracı, Kızıl Gezegen’de bugüne kadar elde edilen verileri altüst eden bir keşfe imza attı.

SpaceX’in Starship roketi test sırasında patladı: Patlama anı kameralara yansıdı

Elon Musk, onuncu test uçuşu için hazırlanan ve havaya uçan roket ile ilgili ilk bulguları paylaştı.

Güncellemeye basan tamircinin yolunu tutuyor: Dev markadan büyük hata

Google’ın Android 16 sürümünü yayınlamasıyla birlikte bazı telefonlar kullanılamaz hale geldi.

Dünyanın en küçük kemanı üretildi… Saç telinden daha ince

İngiltere’deki Loughborough Üniversitesi’nden fizikçiler, mikroskopla bile zor seçilen dünyanın en küçük kemanını ürettiler. Sadece bir toz zerresi büyüklüğündeki bu mikro keman, çıplak gözle görülmüyor ve sadece mikroskop altında incelenebiliyor.

Robot Köpekler, yetenek yarışmasında şov yaptı

Boston Dynamics, robot videolarında vitesi biraz daha yükseltti ve yetenek yarışmasına etkileyici bir dans performansıyla katıldı.

Yeni PlayStation el konsolu için önemli iddialar ve tüm detaylar

Sony’nin yeni taşınabilir el konsolunun PS5 oyunlarını düşük güç modunda çalıştırabileceği iddia ediliyor. Peki bu ne anlama geliyor?