Alibaba, hibrit yapay zeka modeli ailesi Qwen3 yarışa dahil oldu

Alibaba’nın Yeni Hibrit Yapay Zeka Modeli Qwen3 Tanıtıldı




Çin’in teknoloji devi Alibaba, yapay zeka alanında ses getiren yeni modeli Qwen3’ü duyurdu. Şirketin “hibrit” yapısıyla öne çıkan bu yeni yapay zeka ailesi, hem Amerika merkezli dev rakipler OpenAI ve Google’ın modelleriyle yarışıyor hem de açık kaynak yaklaşımıyla dikkat çekiyor.

Devlere karşı güçlü performans

Qwen3 ailesi, 235 milyardan 600 milyon parametre sayısına kadar değişen çeşitli modellerden oluşuyor. Parametre sayısı, bir yapay zeka modelinin problem çözme yeteneğini etkileyen önemli bir ölçüttür. Alibaba’ya göre, en büyük modellerinden biri olan Qwen-3-235B-A22B, OpenAI’ın o3-mini ve Google’ın Gemini 2.5 Pro modellerini bazı karşılaştırmalarda geride bırakıyor. Qwen3 modelleri, OpenAI’nin o3 ve o4-mini gibi en üst düzey yeni modellere üstün gelmiyor, ancak yine de güçlü bir performans sergiliyorlar.

Ancak en güçlü model henüz kamuya açık değil. Bunun yerine, Qwen3-32B gibi daha küçük ancak yine de etkileyici performans gösteren modeller Hugging Face ve GitHub üzerinden indirilebilir durumda. Qwen3 modellerine ayrıca Fireworks AI ve Hyperbolic gibi bulut servis sağlayıcıları aracılığıyla da erişilebilmektedir.

Hibrit yaklaşım benimseniyor




Qwen3 modellerinin en dikkat çekici özelliklerinden biri olan “hibrit” yapısı, modelin karmaşık sorunlara karşı düşünme süreci uygulamasını ve basit sorulara hızlı cevap vermesini sağlar; yani model, gerektiğinde düşünür. Kullanıcılar, modelin ne kadar “düşüneceğine” karar verebilir. Alibaba mühendisleri bu esnekliği “düşünme bütçesinin kontrolü” olarak adlandırıyor. Bu tür çözümleri yakın zamanda görmeye başladık.

Ayrıca, bazı Qwen3 modelleri, “uzmanlar karışımı” (Mixture of Experts – MoE) mimarisiyle çalışıyor. Bu yöntem, işlemleri alt görevlere ayırarak uzman alt modellere dağıtır, böylece karar alma süreci tek bir merkeze bağlı kalmadan daha verimli ilerler.

119 dil ve 36 trilyon token

Alibaba, Qwen3’ün 119 dilde destek sağladığını ve yaklaşık 36 trilyon token (Tokenler, bir modelin işlediği ham veri parçacıklarıdır; 1 milyon token yaklaşık 750.000 kelimeye eşdeğerdir) ile eğitildiğini belirtiyor. Eğitim verileri arasında ders kitapları, soru-cevap çiftleri, yazılım kodları ve yapay zeka tarafından üretilmiş veri kümeleri bulunmaktadır. Bu geniş veri havuzu sayesinde Qwen3, yalnızca genel bilgi sorularında değil, matematik ve yazılım testlerinde de güçlü performans sergilemektedir. Örneğin, LiveCodeBench gibi yazılım karşılaştırmalarında OpenAI’ın o1 modelini geride bırakmayı başarmaktadır. Alibaba, Qwen3’ün araç çağırma yeteneğinin yanı sıra talimatları takip etme ve belirli veri formatlarını kopyalama konusunda da “üstün” olduğunu belirtiyor.

Related Posts

Bu telefonlara sahipseniz dikkat: Tarihe karışıyor

LG, Android akıllı telefonları için güncelleme sunucularının 30 Haziran’da kapanacağını duyurdu

DeepSeek R2, maliyetleri yüzde 97 oranında düşürdü!

Çin merkezli yapay zeka şirketi DeepSeek, yeni nesil modeli R2 ile birlikte sektörde güçlü bir atılım yapacak. Sızdırılan bilgilere göre, DeepSeek R2 önceki nesil performansını iki katına çıkararak saniyede 1.2 trilyon işleme ulaşıyor. DeepSeek R2 …

Çip devi TSMC, dünya genelinde 24 fabrika inşa ediyor

Tayvan merkezli teknoloji devi TSMC, yüksek teknoloji çiplerin üretiminde dünya lideri konumunda. Şirket, yapay zeka sektöründeki artan çip talebi nedeniyle üretim kapasitesini hızla artırıyor. Şu anda dünya genelinde 24 fabrika inşa eden TSMC …

YOU, final sezonu ile izleyicilerde buluştu!

Netflix’in psikolojik gerilim dizisi YOU, beşinci ve son sezonuyla 24 Nisan 2025’te izleyiciyle buluştu. Penn Badgley’nin canlandırdığı Joe Goldberg karakteri, bu sezonla birlikte ekranlara veda edecek. Tüm bölümler aynı anda yayınlandı. YOU, final …

Photoshop için yeni yapay zeka aracı geldi!

Adobe, yapay zeka desteğini genişletmeye devam ediyor. Şirket, Adobe Max etkinliğinde Photoshop kullanıcılarına yönelik yeni bir AI aracını tanıttı. Yeni teknoloji, kullanıcıların program içinde gerçekleştirdiği pek çok işlemi otonom şekilde …

Zuckerberg, uğruna 1 milyar dolar harcadığı Instagram’ı hiç sevmemiş!

Instagram uzun yıllar boyunca Facebook’un üvey çocuğu gibi, kötü bir arayüz ve çok yetersiz özelliklerle çalıştı. Meğer bu ilgisizliğin nedeni, büyük patron Zuckerberg’in uygulamayı hiç sevmemesiymiş.

Bir yanıt yazın

E-posta adresiniz yayınlanmayacak. Gerekli alanlar * ile işaretlenmişlerdir