Yapay zekanın kayıp dilleri yeniden okuyabilmesi merak uyandırıyor. MIT’deki bu araştırma ile unutulmuş bazı diller gün yüzüne çıkabilir, işte detaylar.

Yapay zeka ölü dilleri diriltecek! Dil bilimi araştırmacıları, tarihte unutulmuş olan kayıp dillerdeki eski metinleri deşifre etmelerine yardımcı olmak için makine öğrenimiyle yapay zekaya dayalı bir sistem geliştirdiler.

Şimdiye kadar var olan çoğu dilin artık konuşulmadığını hepimiz biliyoruz. Anlamadığımız için bu dillerin çoğunu da kayıp olarak kabul ediyoruz. Metinleri anlayabilmek için dil bilgisi, kelime bilgisi veya sözdizimi hakkında yeterince bilgimiz yok ancak bizim bulamadığımız kayıp diller için yapay zekayı kullanabiliriz.

Şimdi MIT araştırmacıları, kayıp dilleri deşifre edebildiği kanıtlanan makine öğrenimine dayalı bir sistem geliştirdiler. MIT yapay zekasının genel amacı, sadece birkaç bin kelime kullanarak kayıp dilleri deşifre edebilmek. Araştırmacılara göre halihazırda Linear B kayıp dili hakkında çalışmalar başlamış durumda.

Yapay zekanın kayıp dilleri yeniden okuyabilmesi merak uyandırıyor

MIT Dil Bilimi Profesörü Regina Barzilay liderliğindeki çalışma, dillerin genellikle sadece tahmin edilebilir şekillerde geliştiğini gösteriyor. Yani kayıp olan bir dilin tamamen ortaya çıkarmak mümkün değil, yalnızca sözdizimi hakkında yorumlar yapabiliyoruz: Örneğin “p” harfi zamanla bazı kelimelerde “b” harfine dönüşebilir.

MIT doktora öğrencisi Jiaming Luo ise dil değişikliği kalıplarını yakalamayı sağlayan bir algoritma geliştirdi. Sistem böylece eski bir dildeki kelimeleri bölümlere ayırabilir ve ilgili dil için haritalayabilir. Halihazırda Linear A ve Linear B dilleri üzerine araştırma yürüten bu algoritma,  iki dil arasındaki yakınlığı bile değerlendirebilme kapasitesine sahip.

Yaptığı açıklamada İngilizce, Rusça ve Çinçe dilleri üzerinden örnekler veren Luo, kayıp olan bu iki dildeki alfabe sistemini şöyle özetliyor:

“Büyük harfleri saymazsanız İngilizcede 26 harf, Rusçada 33 harf vardır. Bunlara alfabetik sistemler denir. Yani bu 26 veya 30’luk karakter için bir harita oluşturabilirsiniz. Ama Çinliler için bunlardan binlercesiyle uğraşmak zorundasınız. Çinçe bir gazete okumak için ustalaşılması gereken minimum karakter miktarı yaklaşık 3.000 veya 5.000 kadar. Linear A dili Çince değildir, ancak resimsel veya logogram sembolleri nedeniyle kesinlikle Linear B’den daha zor.”