elektrik port üyelik servisleri elektrik port üyelik servisleri

MIT Yapay Zeka İle Ölü Dilleri Tercüme Edecek

MIT Bilgisayar Bilimleri ve Yapay Zeka Laboratuvarında (MIT CSAIL) geliştirilen sistem, dilbilimcilerin zamanla yok olan dilleri çözmelerine yardımcı olmayı hedefliyor. Detayları haberimizde inceleyeceğiz.



A- A+
02.11.2020 tarihli yazı 6672 kez okunmuştur.
Araştırmalar,  tarihte var olmuş çoğu dilin artık konuşulmadığını gösteriyor. Bu kadim dillerin büyük çoğunluğunun yok olmuş veya çözülmemiş olduğu kabul ediliyor. Bu sebeple bu dillere ait metinleri anlayabilmek için dilbilgisi, kelime dağarcığı veya sözdizimi hakkında yeterince bilgimiz yok. Kayıp dilleri çözümlemediğimizde bu dilleri konuşan insanlar hakkındaki tüm bilgileri de kaybediyoruz. 

Bu kadim dillerle ilgili o kadar az kayıt var ki, bilim insanları tarafından Google Translate gibi makine çevirisi algoritmalarını kullanarak bu dilleri deşifre etmek mümkün değil. Bu kadim dillerden bazılarının karşılaştırılarak çözümlenmesini sağlayacak başka bir dil yok ve genellikle günümüzde kullandığımız boşluk ve noktalama işaretleri gibi dillerin çözümlenmesini kolaylaştıracak ayırıcılardan da yoksunlar. (Örneklemek gerekirse, buşekildeyazılanbirdilintercümesininzorluğunutahminedin)

 

MIT Bilgisayar Bilimleri ve Yapay Zeka Laboratuvarı'ndaki araştırmacılar kısa bir süre önce bu alanda büyük bir yeniliğe imza attılar. Yok olmuş bir dilin diğer dillerle ilişkisine dair bilgiye ihtiyaç duymadan otomatik olarak çözümleyebilen yeni bir sistem geliştirdiler. Ayrıca, geliştirdikleri sistemin kendi başına diller arasındaki ilişkileri analiz edebileceğini de tespit ettiler ve bunu İber dilinin Bask dili ile ilgisi olup olmadığını öne süren son araştırmaları desteklemek için kullandılar.

Ekibin asıl hedefi, geliştirdikleri sistemin sadece birkaç bin kelime kullanarak dilbilimcilerin çözümlemek için yıllarını verdikleri kayıp dilleri deşifre edebilmek ve dillerin yok olmasının önüne geçebilmek. Profesör Regina Barzilay'ın öncülüğünü yaptığı sistem, dillerin genellikle belirli öngörülebilir şekillerde geliştiği gerçeği gibi dilbilimin temel  ilkelerine dayanmaktadır. Örneğin, ana dilde içinde "p" harfi bulunan bir kelime, kendi soyundan gelen bir dilde "b" harfine dönüşebilir, ancak telaffuz farklılığından dolayı "k" harfine geçiş olasılığı oldukça düşüktür.

Barzilay ve MIT’de doktora öğrencisi olan Jiaming Luo, bunları ve diğer dilsel kısıtlamaları bir araya getirerek olası dönüşüm ihtimallerini ve girişteki bir kılavuz sinyalin kıtlığını işleyebilen bir deşifre algoritması geliştirdi. Bu algoritma, dildeki seslerin, telaffuz farklılıklarının karşılık geldiği vektörler arasındaki mesafeye yansıtıldığı çok boyutlu bir alana gömmeyi öğrenir. Bu tasarım, dil değişikliğinin ilgili kalıpları yakalamasını sağlıyor.

 

Ortaya çıkan model, kelimeleri eski bir dilde segmentlere ayırıyor ve bunları ilgili bir dildeki kalıplarla eşleştiriyor. Proje, Barzilay ve Luo'nun geçen yıl yazdığı Ugaritik ve Lineer B gibi ölü dilleri deşifre eden bir makaleye dayanıyor. Bununla birlikte, bu çalışmanın temel farkı, ekibin bu dillerin İbranice ve Yunanca'nın ilk biçimleriyle ilişkili olduğunu önceden bilmesidir.

Geliştirilen yeni sistemle, diller arasındaki ilişki yapay zeka algoritması ile açığa çıkarılmaktadır. Diller arasındaki ilişki dilleri çözümlemedeki en büyük zorluklardan biridir. Lineer B dilinin, günümüzde bilinen dil ailesini keşfetmek araştırmacıların yıllarını aldı. Bilim insanlarını bazı dil aileleri konusunda hala ortak bir kanaate varamıyor. Örneğin bazıları Baskça ile İberce’nin aynı aileden olduğunu savunurken, diğerleri bu hipotezi reddediyor ve İbercenin bilinen herhangi bir dille ilgisi olmadığını öne sürüyor. 

 

Geliştirilen algoritma, iki dil arasındaki yakınlığı değerlendirebiliyor ve yakınlıkları bilinen diller üzerinde test edildiğinde, dil ailelerini oldukça doğru bir şekilde tanımlıyor. Ekip, algoritmalarını Baskça ile İberce, Romence, Cermen, Türk ve Ural ailelerinden farklı dillere uyguladı. Sonuçlara göre Baskça ve Latince, İberceye diğer dillerden daha yakın olsalar da, akraba sayılamayacak kadar farklıydı.

Ekip, gelecekteki çalışmalarını, metinleri “akrabalık temelli deşifre” olarak adlandırılan yöntemle, bilinen bir dildeki ilgili kelimelere bağlama eyleminin ötesine genişletmeyi umuyor.  Ekibin yeni yaklaşımı, nasıl telaffuz edileceğini bilmeseler bile kelimelerin anlamlarını belirlemeyi içeriyor. Barzilay, "Örneğin, bir belgede adı geçen kişilere veya yerlere yapılan tüm referansları belirleyebiliriz ve bunlar daha sonra bilinen tarihsel kanıtlar ışığında daha ayrıntılı bir şekilde incelenebilir. Bu varlık tanıma yöntemleri, günümüzde çeşitli metin işleme uygulamalarında yaygın olarak kullanılmaktadır ve oldukça doğru sonuçlar vermektedir. Ancak temel araştırma sorusu, görevin antik ve kayıp bir dilde herhangi bir eğitim verisi olmadan gerçekleştirilebilir olup olmadığıdır." diyor.


Kaynak:

► sciencedaily.com

 

ANKET
Endüstri 4.0 için En Hazır Sektör Hangisidir

Sonuçlar
Aktif etkinlik bulunmamaktadır.