Neden Türkiye'nin Kendi AI Çözümlerine İhtiyacı Var?
Veri egemenliği, dil bariyeri, jeopolitik bağımsızlık ve ekonomik fırsat — Türkiye'nin yapay zeka alanında kendi çözümlerini üretmesi neden stratejik bir zorunluluk? Verilerle ve örneklerle analiz ediyoruz.
2025 yılında Fransa, yapay zeka altyapısına 109 milyar Euro yatırım planı açıkladı. BAE, Falcon dil modeliyle açık kaynak dünyasında söz sahibi oldu. Güney Kore, NVIDIA ile 260.000’den fazla GPU kapasiteli egemen bulut altyapısı kurmak için anlaştı. Çin zaten yıllardır kendi ekosistemini inşa ediyordu — DeepSeek ve Baidu ERNIE gibi modeller artık küresel sahnede.
Peki Türkiye nerede duruyor? Ve daha önemlisi: neden sadece kullanıcı değil, üretici de olması gerekiyor?
Türkçe, Global Modellerin Kör Noktası
Yapay zeka modellerinin çoğu İngilizce merkezli eğitim verileriyle oluşturulur. Türkçe gibi sondan eklemeli (agglutinative) diller bu modeller için ciddi bir zorluk oluşturur. Bunun sebebi basit: Türkçe’de tek bir kelime, İngilizce’de bütün bir cümlenin taşıdığı anlamı barındırabilir. “Evlerinizden” kelimesi — ev, çoğul eki, iyelik eki, ayrılma hâl eki — hepsi tek kelimede.
Rakamlarla konuşalım. Mevcut tokenizer’lar Türkçe metni kelime başına 1,95 ile 3,03 token arasında parçalar. İngilizce’de bu oran 1,0-1,3 civarında kalır. Bu ne demek? Aynı anlam için Türkçe metin, modelin işlem kapasitesinin neredeyse iki-üç katını tüketiyor. Ocak 2025’te yayınlanan TR-MMLU benchmark çalışması, büyük dil modellerinin Türkçe’deki performansını sistematik olarak ölçtüğünde sonuçlar net: morfolojik hatalar, hedef dışı üretimlerin üçte birinden fazlasını oluşturuyor. Ünlü uyumu ihlalleri, ek sıralama hataları, uyum bozuklukları — bunlar ChatGPT ya da Gemini’nin “Türkçe biliyorum” demesiyle çözülecek sorunlar değil.
Mesele sadece gramer de değil. Hukuki metinler, tıbbi raporlar, resmi yazışmalar — bu alanlarda %95 doğruluk yetmez. Tek bir ekin yanlış kullanımı, bir sözleşmenin anlamını tamamen değiştirebilir.
Veri Egemenliği: Sadece Teknik Değil, Hukuki Zorunluluk
Türkiye’nin 6698 sayılı KVKK (Kişisel Verilerin Korunması Kanunu), 2025 itibarıyla ciddi güncellemeler aldı: veri taşınabilirlik hakkı, otomatik kararlara itiraz hakkı ve 72 saatlik ihlal bildirim zorunluluğu. Sınır ötesi veri aktarımları için yeni hiyerarşik değerlendirme yöntemi getirildi.
Bunun ötesinde, Haziran 2024’te TBMM’ye sunulan Yapay Zeka Yasa Tasarısı (8 madde), AB AI Act’e paralel bir risk bazlı yaklaşım benimsiyor. Yüksek riskli AI sistemleri için risk değerlendirmesi, kayıt ve uygunluk denetimi zorunluluğu getiriyor.
Bu düzenlemeler bir gerçeğe işaret ediyor: Türk vatandaşlarının verileri üzerinde işlem yapan AI sistemlerinin, Türk hukuk çerçevesinde denetlenebilir olması gerekiyor. ABD merkezli bir bulut sağlayıcının sunucularında, ABD yasalarına tabi olarak çalışan bir model üzerinde bu denetimi sağlamak — en hafif ifadeyle — zor.
Temmuz 2025’te yaşanan Grok krizi bunu somutlaştırdı. xAI’ın Grok chatbotu, Türk siyasetçiler hakkında küfürlü ve hakaret içerikli Türkçe çıktılar üretti. Türkiye, Grok’a karşı soruşturma başlatan ilk ülke oldu. KVKK, X Internet ve X.AI Corporation hakkında re’sen inceleme başlattı. 50 Grok paylaşımı mahkeme kararıyla engellendi. Ayrıca rıza dışı cinsel içerikli AI üretimleri için ayrı bir soruşturma açıldı.
Kendi AI çözümleriniz olmadığında, başkalarının çözümlerinin yarattığı sorunlarla başa çıkmak zorunda kalıyorsunuz.
Jeopolitik Konum: Bağımsızlık Bir Tercih Değil, Zorunluluk
CSIS (Stratejik ve Uluslararası Çalışmalar Merkezi), Türkiye’nin dış politikasını “stratejik belirsizlik” kavramıyla tanımlıyor. NATO üyesi ama bağımsız dış politika izleyen, Batı ittifakında yer alan ama Doğu ile diyaloğunu sürdüren bir ülke. Harvard Belfer Center’ın analizi iki stratejik seçenek sunuyor: ABD önceliklerine seçici uyum ya da Çin ve Rusya dahil Batı-dışı aktörlerle çeşitlendirme.
Bu konum AI için de geçerli. Tamamen ABD teknolojisine bağımlı bir AI altyapısı, Türkiye’nin stratejik esnekliğini kısıtlar. Tamamen Çin ekosistemine yönelmek ise Batı ittifaklarıyla uyumsuzluk yaratır. Çözüm, Fransa’nın yaptığı gibi, kendi egemen AI kapasitesini inşa etmek.
Savunma sanayii bunu zaten kanıtladı. Bayraktar gibi AI destekli insansız hava araçları, Türkiye’nin stratejik otonomisine doğrudan katkı sağlıyor. Aynı mantık sivil AI için de geçerli — sağlık, hukuk, finans ve kamu hizmetlerinde bağımsız AI kapasitesi, ulusal güvenliğin bir parçası.
Türkiye’nin Mevcut Kapasitesi: Sıfırdan Başlamıyoruz
Türkiye bu yarışa tamamen hazırlıksız değil. Önemli adımlar atılmış durumda:
Ulusal Strateji ve Politika
Ağustos 2021’de Resmi Gazete’de yayınlanan Ulusal Yapay Zeka Stratejisi (2021-2025), altı stratejik öncelik belirledi. Hedefler net: AI’ın GSYH’ye katkısını %5’e çıkarmak, AI istihdamını 50.000 kişiye ulaştırmak, lisansüstü öğrenci sayısını 10.000’e taşımak. 2024-2025 Eylem Planı ile strateji güncellendi. Haziran 2025’te Sanayi ve Teknoloji Bakanlığı, proje başına 50 milyon TL’ye kadar hibe desteği sunan Türkçe Büyük Dil Modeli Sektörel Uyarlama Proje Çağrısı’nı başlattı.
Yerli Dil Modelleri
Kumru AI (VNGRS tarafından geliştirildi), Türkiye’nin ilk yerli büyük dil modeli olarak Eylül 2025’te tanıtıldı. 7,4 milyar parametreli, decoder-only mimariye sahip model, 500 GB temizlenmiş Türkçe veri (300 milyar token) üzerinde 45 gün eğitildi. Eğitim verileri arasında mahkeme kararları, tıbbi dergiler, OCR’lanmış gazeteler ve meclis tutanakları var. Özel BPE tokenizer’ı sayesinde diğer modeller aynı Türkçe metin için %38 ila %98 daha fazla token harcıyor. Türkçe dilbilgisi benchmarklarında %92 doğruluk oranına ulaştı. Açık kaynak Kumru-2B versiyonu mobil cihazlarda çalışabilecek boyutta (4,8 GB). 2026 Q2’de 1 trilyon token üzerinde eğitilecek 14B parametreli bir halef modeli planlanıyor — TÜBİTAK 2247 hibesiyle finanse edilen Türkçe RLHF pipeline’ı ile.
TURNA (Boğaziçi Üniversitesi TABILAB), 1,1 milyar parametreli T5 tabanlı model olarak ACL 2024’te — dünyanın en prestijli NLP konferansında — sunuldu. Birçok çok dilli modeli Türkçe anlama görevlerinde geride bıraktı.
Turkcell-LLM-7b, 5 milyar token Türkçe veri üzerinde eğitildi. cosmosGPT (Yıldız Teknik Üniversitesi), sadece Türkçe veri üzerinde eğitilen monolingüal GPT modelleri olarak çok dilli alternatiflerinden 10 kat küçük olmasına rağmen umut verici sonuçlar ortaya koydu.
Altyapı Yatırımları
Türkiye’nin veri merkezi pazarı 2025’te 2,49 milyar dolar değerinde ve 2035’e kadar 5,73 milyar dolara ulaşması bekleniyor. En önemli gelişme, Turkcell ve Google Cloud ortaklığıyla kurulan 3 milyar dolarlık Türkiye’nin ilk hiperölçekli bulut bölgesi — Ankara’da üç senkronize veri merkezi, 2028’de tam kapasiteye ulaşacak. Equinix, İstanbul’da 93 milyon dolarlık satın alma ve AI iş yükleri için sıvı soğutmalı yeni tesis (IL4) açtı.
Akademik Kapasite
İTÜ, Türkiye’nin ilk Yapay Zeka ve Veri Mühendisliği bölümünü kurdu. Boğaziçi, ODTÜ, Bilkent ve Koç üniversiteleri AI araştırmalarında aktif. Türk üniversiteleri her yıl mühendislik ve bilgisayar bilimlerinde 80.000’den fazla mezun veriyor.
”Ama Global Modeller Zaten Türkçe Biliyor” Argümanı
ChatGPT ile Türkçe sohbet edebiliyorsunuz — doğru. Ama bu, Türkiye’nin kendi çözümlerine ihtiyaç duymadığı anlamına gelmiyor. Birkaç neden:
1. Performans eşitsizliği gerçek. Global modeller Türkçe’de İngilizce performanslarının çok altında kalıyor. Morfolojik hatalar, token şişkinliği ve kültürel bağlam eksikliği, profesyonel kullanım senaryolarında ciddi sorunlar yaratıyor.
2. Maliyet çarpanı. Token şişkinliği sadece doğruluk sorunu değil — maliyet sorunu. Türkçe metin için 2-3 kat daha fazla token harcamak, API maliyetlerinin de 2-3 kat artması demek. Yerli bir tokenizer bu farkı sıfıra yakın bir seviyeye indirebilir. Kumru’nun özel tokenizer’ı bunu zaten kanıtladı.
3. Sektörel uyum. Türk hukuk sistemine göre eğitilmemiş bir model, Türk mahkeme kararlarını doğru yorumlayamaz. Türk tıbbi terminolojisini bilmeyen bir model, sağlık sektöründe güvenle kullanılamaz. Bu modellerin Türkiye’ye özgü verilerle fine-tune edilmesi bile yetmez — temel eğitimde bu verilerin bulunması gerekir.
4. Bağımlılık riski. OpenAI’ın, Google’ın veya herhangi bir yabancı şirketin API fiyatlandırmasını değiştirmesi, hizmet şartlarını güncellemesi veya belirli bölgelere erişimi kısıtlaması — bunların hepsi kontrol edemediğiniz riskler. Kendi altyapınız, kendi kurallarınız.
Başarılı Örnekler: Kendi Yolunu Çizen Ülkeler
Fransa’nın yaklaşımı özellikle ilham verici. Mistral AI, Eylül 2025’te ASML liderliğinde 1,7 milyar Euro (2,9 milyar dolar) Series C yatırım aldı. 18.000 NVIDIA Grace Blackwell Superchip ile 40MW kapasiteli kendi hesaplama merkezini (“Mistral Compute”) kuruyor. Fransız hükümetiyle savunma anlaşması imzaladı. Fransa ve BAE, “sanal veri elçilikleri” kavramını tanıtarak 1 gigawatt kapasiteli ortak AI veri merkezi için 30-50 milyar dolarlık yatırım planı açıkladı.
BAE, Teknoloji İnovasyon Enstitüsü (TII) aracılığıyla açık kaynak Falcon LLM’yi geliştirdi ve sovereign wealth fonlarıyla hesaplama gücünü kontrol altına alan bir model izledi.
Almanya, Fransa ve Hollanda birlikte 2024-2025 döneminde egemen hesaplama altyapısına 4,2 milyar Euro’dan fazla yatırım yaptı.
Bu ülkelerin ortak noktası: hiçbiri “ABD modelleri yeterli” demedi. Hepsi kendi kapasitelerini inşa etti.
Türkiye İçin Yol Haritası
Mevcut altyapı ve stratejiler iyi bir başlangıç noktası sunuyor. Ama dürüst olmak gerekirse, 50 milyon TL’lik hibe ile 109 milyar Euro’luk yatırım arasında devasa bir fark var. Türkiye’nin atması gereken adımlar:
Hesaplama altyapısına odaklanmak. Turkcell-Google Cloud ortaklığı önemli ama yeterli değil. Şu an Türkiye’de AWS, Azure veya Google Cloud’un özel bulut bölgesi yok (Google’ınki 2028’de gelecek). Türk şirketlerinin %70’i hibrit çözüm arayışında — bu talep karşılanmalı.
Açık kaynak ekosistemine yatırım yapmak. Kumru, TURNA ve cosmosGPT gibi modeller umut verici. Ama bunların sürdürülebilir olması için akademi-sanayi iş birliğinin derinleşmesi, eğitim verisi havuzlarının genişletilmesi ve topluluğun büyütülmesi gerekiyor.
Sektörel dikey çözümler geliştirmek. Her şeyi yapan genel amaçlı bir model yerine, hukuk, sağlık, finans ve kamu hizmetleri gibi kritik sektörlere özel Türkçe AI çözümleri daha hızlı ve etkili sonuç verir. Bakanlığın Sektörel Uyarlama Çağrısı doğru yönde — ama ölçeğin büyümesi şart.
Regülasyonu fırsata çevirmek. KVKK ve AI Yasa Tasarısı, doğru uygulanırsa yerli çözümler için doğal bir pazar avantajı yaratır. Veri yerelleştirme gereksinimleri, Türkiye’de barındırılan ve Türk hukukuna uygun AI çözümlerine olan talebi artırır.
Sonuç: Bu Bir Teknoloji Yarışı Değil, Egemenlik Meselesi
Yapay zeka artık bir yazılım kategorisi değil — bir altyapı katmanı. Elektrik, telekomünikasyon ve internet gibi. Bir ülkenin bu katman üzerinde kendi kapasitesi olmaması, dijital egemenliğinden vazgeçmesi anlamına gelir.
Türkiye, 85 milyonluk nüfusu, yılda 80.000 mühendislik mezunu, 1,6 milyar dolarlık AI pazarı ve stratejik coğrafi konumuyla bu kapasiteyi inşa edecek kaynaklara sahip. Kumru gibi modeller, TURNA gibi akademik çalışmalar ve Turkcell-Google ortaklığı gibi altyapı yatırımları doğru yönde atılmış adımlar.
Ama adımların hızlanması gerekiyor. Çünkü yapay zeka yarışında geç kalmak, sadece teknolojide değil — ekonomide, güvenlikte ve ulusal bağımsızlıkta geç kalmak demek.
Bu yazıdaki veriler CBDDO, KVKK, ACL 2024, TR-MMLU, CSIS, Harvard Belfer Center, Mordor Intelligence, Statista ve ilgili şirketlerin resmi açıklamalarından derlenmiştir.