Yerli yapay zeka Cosmos T1, kendisinden üç kat büyük modellerle yarışıyor

Yıldız Teknik Üniversitesi Cosmos ekibince geliştirilen ve Türkçe düşünen yapay zeka Cosmos T1, kendisinden 3 kat büyük Google’ın yapay zeka modeline meydan okuyor. META’nın yapay zekasını da performans testinde geçen yerli Cosmos T1, bilgisayarlara yükle
Yıldız Teknik Üniversitesi Cosmos ekibince geliştirilen ve Türkçe düşünen yapay zeka Cosmos T1, kendisinden 3 kat büyük Google’ın yapay zeka modeline meydan okuyor. META’nın yapay zekasını da performans testinde geçen yerli Cosmos T1, bilgisayarlara yüklenerek özgürce kullanılabiliyor ve güvenlik riskini ortadan kaldırıyor.
Yıldız Teknik Üniversitesi Bilgisayar Mühendisliği ile Yapay Zeka ve Veri Mühendisliği Bölümü Öğretim Üyesi Prof. Dr. Mehmet Fatih Amasyalı öncülüğünde, akademisyenlerden oluşan Cosmos ekibi, Türkçe düşünen yapay zeka Cosmos T1’i geliştirdi. Model, matematiksel akıl yürütme performansını ölçen Türkçe GSM8K veri setinde yüzde 77,41 doğruluk oranına ulaştı. Model, zincirleme akıl yürütme (chain-of-thought reasoning) yaklaşımıyla Türkçe matematik problemlerini çözebiliyor.
Turkish-Gemma-9b-T1 modeli, Türkçe GSM8K testinde yüzde 77,41 doğruluk oranına ulaştı. Aynı testte Gemma-2-9B modeli yüzde 63,10, Llama-3.1-70B modeli ise yüzde 66,13 performans gösterdi. 9 milyar parametreli model, 70 milyar parametreli Llama-3.1-70B modelinin üzerinde performans gösterdi. Parametre sayısı açısından kendisinden yaklaşık sekiz kat büyük modellerle rekabet edebilecek seviyeye ulaştı.
9 milyar parametreli Turkish-Gemma-9b-T1 modeli, Türkçe matematiksel akıl yürütme testlerinde 70 milyar parametreli modellere yakın veya üzerinde performans sergileyerek parametre verimliliği açısından dikkat çekti. Model, Hugging Face platformu üzerinden açık ağırlıklı olarak erişime açıldı.

"Kendi bilgisayarlarına kurup özgürce kullanabiliyorlar"
Çalışmanın yürütücüsü Prof. Dr. Amasyalı, "Cosmos T1 bizim en son çıkan modellerimizden bir tanesi, dil modeli geliştiriyoruz temelde. Chat GPT ve benzeri modelleri geliştiriyoruz. T1 diğerlerinden farklı bir düşünce sürecine sahip ve bu düşünce sürecini Türkçe olarak yansıtıyor. Bütün arka planda yanıtın nasıl üretildiğini ara yüzden adım adım görebiliyoruz. Aslında Chat GPT ile farklı kulvardalar. Birçok sektör günümüzde verilerini sağlık ve savunma sanayi gibi bu tarz firmalarla paylaşamıyor, paylaşmak istemiyor, paylaşmaması da çok doğal. Bunun yerine on-premise’de çözüm üretmeleri yani kendi makinelerinin çalışması gerekiyor. T1’in ve bizim diğer ürettiğimiz modellerin hepsi aslında açık ağırlıklı olarak yayınlanıyorlar ve insanlar da bu modelleri kendi bilgisayarlarına kurup kendi şirketlerinde özgürce ve rahatça kullanabiliyorlar" dedi.

Firmalar kendi süreçlerine dahil ederek güvenliği artırıyor
T1 Modelin 9 milyar parametresi olduğunu ve büyüklüğüne göre oldukça iyi işler ortaya çıkardığını belirten Amasyalı, sözlerini şöyle sürdürdü:
"İki türlü erişim mümkün. Birincisi; online bir web sayfası var. İkincisi; firmalar açık ağırlık olarak yayınladığımız modeli kendi bilgisayarlarına indirip, kendi süreçlerine dahil ederek rahatça kullanabiliyorlar. TÜBİTAK projeleri kapsamında geliştirme maliyetini, Türkçesinin iyileştirme maliyetini biz karşılıyoruz. Firmalar da Türkçesi iyileştirmiş olan modelleri kendi süreçlerinde rahatlıkla kullanabiliyorlar."

"Önce düşünüp sonra cevap vermesi performansı artırıyor"
Cosmos T1’in Google’ın yapay zeka modeli Gemma 2 modelinin üzerine geliştirildiğini belirten Amasyalı, "Fakat Türkçesini biz burada çok çok iyileştirmeyi düşündük ve ‘thinking’ düşünen bir model geliştirdik. Gemma 2 modelinde temelde böyle bir özellik yok. Gemma 2 soru sorunca cevap veren bir model, Cosmos T1’de ise bir düşünce süreci, onun arkasından bir cevap üretme süreci var ki bu da modellerin performansını çok artırıyor. Önce düşünüp sonra cevap verdiğinde direkt cevaba geçmektense çok daha iyi bir performans sergiliyor" ifadelerini kullandı.
Prof. Dr. Mehmet Fatih Amasyalı, "Biz bunun üzerine oldukça sağlam bir eğitim gerçekleştirdik ve onu düşünmeyen bir modelden düşünen bir model haline getirdik. Bu sayede de kendisinden 3 kat büyük olan modellerle yarışabilecek seviyeye ulaştı. Bu başarı da günümüzde sosyal medyada epey ilgi gördü. Aslında isteyince, çalışınca oluyor. Sağlam bir ekiple ve büyük bir motivasyonla bunları gerçekleştirdik. TÜBİTAK’ın arkamızda olması en büyük motivasyonumuzdu" diyerek sözlerini sonlandırdı.