DeepSeek'in gelişen yapay zeka stratejileri, ABD ve Çin arasındaki rekabeti nasıl etkileyebilir?
Birçok gözlemci ABD’deki yapay zeka yatırımlarının ve geliştirme çalışmalarının rotasını çoktandır sorguluyor. Neredeyse bütün şirketlerin aynı yöntemlerle ilerlediği sektör bütün yumurtaları aynı sepete koymuş gibi. Çinli DeepSeek sektörü rehavetten uyandırabilir.
20 Ocak’ta DeepSeek-R1’in piyasaya çıkışı sonrası çip üreticisi Nvidia’nın hisselerinde ve birçok teknoloji şirketinin değerinde keskin düşüş görüldü.
Yaşananlar kimilerince Çin ile Amerika arasındaki yapay zeka yarışının “Sputnik anı” ilan edildi Böyle bir uyanış Amerikan yapay zeka sektörü için hayırlı sayılabilir. Ama son gelişmeler bazı ciddi sorular da getirdi.
Oksijen’den Daron Acemoğlu “Yapay zeka için uyanma vaktı: DeepSeek” başlıklı yazı kaleme aldı.
Acemoğlu’nun yazısının tamamı şu şekilde:
ABD teknoloji sektörü yapay zekaya devasa yatırımlar yaptı ve yapıyor. Goldman Sachs’ın tahminine göre, “Önümüzdeki yıllarda mega teknoloji firmaları, kurumsal şirketler ve kamu hizmeti veren kuruluşların yapay zekayı güçlendirmek üzere 1 trilyon doları civarı sermaye harcaması yapması bekleniyor.” Ancak ben de dahil birçok gözlemci ABD’deki yapay zeka yatırımlarının ve geliştirme çalışmalarının rotasını çoktandır sorguluyor.
Kısmen açık kaynaklı modeliyle biraz ayrışan Meta bir yana, bütün şirketlerin aynı yöntemlerle ilerlediği sektör bütün yumurtaları aynı sepete koymuş görünüyor. Amerikalı teknoloji şirketleri istisnasız biçimde büyüklüğe kafayı takmış durumda. Henüz ne olduğu belli olmayan “büyütme yasalarına” atıfta bulunarak daha fazla kabiliyete giden tek yolun mevcut modellere daha da fazla veri ve bilişim gücü sağlamaktan geçtiğini savunuyorlar. “Tek ihtiyacınız olan şey büyüme” iddiasında bulunanlar bile var.
20 Ocak öncesinde Amerikalı şirketler dizilerdeki bir sonraki sözcüğü öngörmek üzere devasa veri kümeleri üzerinden eğitilmiş temel modellerin alternatiflerini dikkate almakta isteksizdi. Öncelikleri sebebiyle neredeyse tamamen insan veya insan benzeri görevleri yerine getirmeye yönelik difüzyon modelleri ve sohbet robotlarına odaklanıyorlardı. DeepSeek de genel olarak aynı yaklaşımı benimsemesine rağmen takviyeli öğrenme, daha küçük ve etkili modellerden oluşan uzmanların karışımı (MoE) yöntemi, bilgi distilasyonu ve rafine fikir dizisine dayalı akıl yürütmeye daha fazla ağırlık vermiş görünüyor.
Söylenenlere bakılırsa bu strateji DeepSeek’in çok daha az maliyetle rekabetçi bir model üretmesini sağladı.
Yaşananlar ABD yapay zeka sektörü içindeki “tek fikirliliği” ortaya döktü. Sektörün alternatif, daha ucuz ve daha çok şey vaat eden yaklaşımları görmezden gelmesi ve süregelen abartılar, Simon Johnson ile üretken yapay zeka çağının hemen öncesinde yazdığımız “İktidar ve Teknoloji” kitabında öngördüğümüz yaklaşımı yansıtıyor. Şu anki esas mesele Amerikan yapay zeka sektörünün başka ve daha da tehlikeli kör noktaları bulunup bulunmadığı. Örneğin Amerika’nın önde gelen teknoloji şirketleri, modellerini daha “insan yanlısı” hale getirme fırsatını kaçırıyor olabilir mi? Böyle olduğu yönünde ciddi şüphelerim.
TEPEDEN İNME HAMLE İNOVASYONU BALTALAR
Bir de Çin’in ABD’yi geride bırakması meselesi var. Gerçekten böyleyse mevcut durum James A. Robinson ile “dışlayıcı kurumlar” olarak tanımladığımız otoriter ve tepeden inme yapıların inovasyonu destekleme konusunda tabandan tepeye ilerleyen sistemlerle baş edebileceği, hatta onları geride bırakabileceği anlamına mı geliyor?
Robinson ile “Ulusların Düşüşü” kitabında tepeden inmeci kontrolün inovasyonu baltaladığını yazmıştık. Aynı fikirdeyim. DeepSeek’in başarısı bu iddiayı yalanlıyor gibi görünse de dışlayıcı kurumlar yönetimindeki inovasyonun kapsayıcı kurumlardakiler kadar güçlü ve dayanıklı olabileceği yönünde kesin kanıt olmaktan uzak. DeepSeek ABD’nin ve kısmen Avrupa’nın yıllardır kaydettiği gelişmeler üzerinden hareket ediyor. Kullandığı temel yöntemlerin öncüleri ABD’den. Uzmanların karışımı (MoE) modelleri ve takviyeli öğrenme on yıllar önce akademik araştırma kurumlarında geliştirilmişti. Dönüştürücü modelleri, düşünce zinciri olarak bilinen akıl yürütmeyi ve distilasyonu ilk kez hizmete koyan da Big Tech olarak bildiğimiz Amerikalı büyük teknoloji şirketleriydi.
DeepSeek’in başarısı mühendislik alanında oldu ve adı geçen yöntemleri Amerikalı şirketlerden daha verimli biçimde birleştirmeyi başardı. Çinli firmaların ve araştırma kurumlarının bir sonraki adımı atıp kendi özgün çığır açıcı teknikleri, ürünleri ve yaklaşımlarıyla sahneye çıkıp çıkmayacakları henüz meçhul.
Dahası, DeepSeek çoğu Çinli yapay zeka firmasından da farklı. Çinli şirketler genellikle teknolojileri ya hükümet için ya da hükümet finansmanıyla üretiyor. DeepSeek bugüne kadar gerçekten de göze çarpmadan faaliyet göstermişse bunca ilgiden sonra yaratıcılığını ve dinamizmini sürdürmesi mümkün olacak mı? Tek şirketin başarısı Çin’in inovasyon alanında açık toplumları yenebileceğine dair kesin kanıt olarak okunamaz.
İşin bir de jeopolitik boyutu var. DeepSeek olayı ABD’nin Çin’deki yapay zeka araştırmalarını dizginlemeye yönelik ihracat kontrollerinin ve diğer tedbirlerinin başarısız olduğu anlamına mı geliyor? Burada da cevap net değil. DeepSeek son modelleri olan V3 ile R1’i eski ve daha zayıf çipler üzerinden eğitmiş olsa da ilerleyişini sürdürmek ve büyümek için hala en güçlü çiplere ihtiyaç duyabilir.
Ne var ki Amerika’nın sürdürdüğü ve kimsenin kazanmadığı oyunun uygulanamaz ve yanlış değerlendirilmiş olduğu aşikar. Böyle bir stratejinin anlamlı olabilmesi için her bilişsel görevde insanlarla aynı düzeye gelebilecek yapay genel zekaya doğru ilerlediğimize ve bunu ilk elde edenin muazzam bir jeopolitik avantajı eline geçireceğine inanmak gerekiyor. Ama hiçbir garantisi bulunmayan bu varsayımlara tutunarak Çin’le birçok alanda verimli olabilecek işbirliğinin önünü kesiyoruz. Örneğin iki ülkeden biri insanların verimini artıran modeller üretir ve bu model yaygın biçimde kullanılmaya başlarsa böyle bir inovasyon iki ülkeye de yarar getirir.
Amerikalı kuzenleri gibi DeepSeek de yapay genel zeka geliştirme niyetinde ve eğitilmesi çok daha ucuza gelen bir model kurmak çok şey değiştirebilir. Ama geliştirme maliyetlerini bilindik yöntemlerle aşağı çekmek mucize yaratıp birkaç yıl içinde yapay genel zekaya ulaşmamızı sağlamayacak. Yapay genel zekanın kısa vadede erişilebilir olup olmadığı sorusu ortada. Bunun arzu edilecek bir şey olup olmadığı gibi daha büyük bir soru da var.
DeepSeek’in modellerini nasıl geliştirdiğine ve görünürdeki başarısının yapay zeka sektörünün geleceği için ne anlam ifade ettiğine tam olarak hakim olmasak da bir gerçek kesin görünüyor: Sonradan ortaya çıkan Çinli bir firma teknoloji sektöründeki büyüklük takıntısını boşa çıkardı. Sektörü kapıldığı rehavetten uyandırması bile mümkün.
patronlardunaysi.com