Yapay zeka modeli GPT-4.5 resmi olarak Turing testini geçti
Yapay zeka alanında önemli bir gelişme yaşandı. OpenAI'nin en son modeli GPT-4.5, insan zekasının ölçütü olarak kabul edilen Turing testini başarıyla geçti.

UC San Diego'nun Dil ve Biliş Laboratuvarı tarafından yürütülen ve henüz akran değerlendirmesi aşamasında olan çalışmada, katılımcılar bir insan ve bir yapay zeka ile eş zamanlı sohbet etti ve hangi tarafın insan olduğunu belirlemeye çalıştı. Yapay zeka modellerine belirli bir kişilik benimsemeleri talimatı verildiğinde, GPT-4.5’in %73 oranında insan olarak değerlendirildiği tespit edildi. Bu oran, %50'lik rastgele tahmin seviyesinin oldukça üzerinde bulunuyor ve testin geçildiğini gösteriyor.
FARKLI MODELLER DE TEST EDİLDİ
Çalışmada yalnızca OpenAI'nin GPT-4.5 modeli değil, Meta'nın LLama 3.1-405B modeli, OpenAI'nin GPT-4o modeli ve 1960'larda geliştirilen ELIZA adlı erken dönem sohbet botu da değerlendirildi. Araştırmanın baş yazarı Cameron Jones, GPT-4.5 ve LLama modellerinin (kişilik yönlendirmesi yapıldığında) insanlardan ayırt edilmesinin şanstan daha iyi olmadığını belirtti.
Turing testi, İngiliz matematikçi Alan Turing tarafından 1950’de ortaya atılmış ve bir makinenin insan benzeri düşünme yeteneğine sahip olup olmadığını ölçmek amacıyla geliştirilmişti. Bu testte, bir sorgulayıcı, bir insan ve bir yapay zeka ile yazılı olarak iletişim kurarak, hangisinin insan olduğunu belirlemeye çalışıyor. Eğer sorgulayıcı yanıtlayıcıları doğru bir şekilde ayırt edemezse, makinenin insan gibi düşünebildiği kabul ediliyor.
YAPAY ZEKA KİŞİLİK BENİMSEDİĞİNDE DAHA İKNA EDİCİ
Araştırmada, yapay zekalara iki farklı şekilde talimat verildi:
-Kimliksiz yönlendirme: Yapay zeka yalnızca "Bir Turing testine katılmak üzeresiniz, amacınız sorgulayıcıyı insan olduğunuza ikna etmektir" şeklinde yönlendirildi.
-Kişilik yönlendirmesi: Yapay zekaya, internet ve kültür hakkında bilgi sahibi genç bir kişi gibi davranması söylendi.
Sonuçlar, kişilik yönlendirmesinin büyük fark yarattığını gösterdi. GPT-4.5, kimliksiz yönlendirmeyle %36 oranında insan olarak algılanırken, kişilik yönlendirmesiyle bu oran %73’e yükseldi. GPT-4o ise yalnızca %21 başarı oranı elde etti. İlginç bir şekilde, eski ELIZA modeli bile %23 oranıyla GPT-4o’yu geride bıraktı.
TURİNG TESTİ GERÇEK BİR ZEKA ÖLÇÜTÜ MÜ?
Bu sonuçlar yapay zekanın insan taklidinde ne kadar ileri gittiğini gösterse de, uzmanlar Turing testinin yapay zekanın gerçek zekasını ölçmek için yeterli olup olmadığı konusunda farklı görüşlere sahip. Google'da yazılım mühendisi olan François Chollet, Nature dergisine verdiği demeçte, "Turing testi daha çok bir düşünce deneyi olarak görülmelidir" dedi.
Jones da çalışmanın yapay zekaların gerçekten insan benzeri bir zekaya sahip olup olmadığı konusunda net bir cevap sunmadığını belirtti. Ancak LLM'lerin (Büyük Dil Modelleri) kısa etkileşimlerde insan gibi davranabildiğine dair önemli kanıtlar sunduğunu vurguladı. Jones, bu durumun iş dünyasında otomasyonun yaygınlaşmasına, sosyal mühendislik saldırılarının gelişmesine ve toplumsal etkiler yaratabileceğine dikkat çekti.
Turing testinin sadece makineleri değil, aynı zamanda insanların teknolojiye bakış açısını da incelediğini belirten araştırmacılar, gelecekte halkın yapay zeka ile daha fazla etkileşime girdikçe, onları daha iyi tanıyabileceğini düşünüyor.
patronlardunyasi.com