elektrik port üyelik servisleri elektrik port üyelik servisleri

Ses Sentezi ile Sesler Kopyalanacak

İnsan benzeri robotların hızla geliştiği yapay zeka çağında bir sonraki adım onları gerçek hayatta seslerle eşleştirmektir. Montreal merkezli şirket, herkesin sesini kopyalayabilen dünyanın ilk ses sentezi teknolojisini duyurdu.



A- A+
30.05.2017 tarihli yazı 3802 kez okunmuştur.

Ses Sentezi Teknolojisi Nasıl Çalışıyor?

Montreal Üniversitesi'ndeki üç doktora öğrencisi tarafından kurulan Lyrebird, kişinin sesini tam olarak kopyalayabilen bir konuşma sentezi çözümü geliştirdi. Sentez, bunu sadece birkaç saniye ses kaydını analiz ederek yapıyor.Lyrebird, bir kişinin sesini bir dakika kaydederek o kişinin ses DNA'sını benzersiz olarak çıkarabilir. Üretici, daha sonra, karşılık gelen ses aralığına sahip herhangi bir konuşma üretebilir. Bu şekilde bildiğiniz veya tanıdığınız birinin sesini taklit ettirmek istemiyorsanız, uygulamayla benzersiz bir ses tasarlayabilirsiniz. Ayrıca seçebileceğinizbinlerce ön tanımlı ses de bulunuyor. Elbette şu anki dijital sesler gibi monoton olsaydı bu kadar özel bir yere sahip olmazdı. Lyrebird'in yapay ses üreticisi, öfke, sempati, stres ve daha birçok insan duygu tonlarını da üretebiliyor. Fakat, bu yeni dijital ses üreticisinin asıl önemi, yarım saniyeden daha kısa sürede 1000 cümle üretebilmesidir!Bu durum, Lyrebird teknolojisini AI speech sentezini ön planına getiriyor.
 


►İlginizi Çekebilir: Yapay Zeka Uygulamaları

Lyrebird'in kurucularından Alexandre de Brébisson, yeni geliştirdiği teknolojinin benzer sesleri üretmek için çok fazla bilgiye ihtiyaç duymadığı konusunda konuştu. "Farklı sesler çok miktarda bilgi paylaşıyor. Birkaç konuşmacının sesini öğrendikten sonra, yepyeni bir konuşmacının sesini öğrenmek çok daha hızlıdır. Bu yüzden tamamen yeni bir ses öğrenmek için o kadar çok veriye ihtiyacımız yok. Daha fazla veriye kesinlikle ihtiyacımız olacak, fakat şu an için bir dakika kayıt, ses DNA'sını yakalamak için yeterli"dedi.


 

Etik Kavramı

Pek çok araştırma çalışması kaçınılmaz olarak etik eleştirilere maruz kalır ve bulgular, amaçlanan kullanımıyla ilgili sıklıkla sorgulanır. Lyrebird'in konuşma sentezi kimlik hırsızlığı gibi birkaç etik sorunla karşı karşıya kalıyor, çünkü birinin sesini tekrarlamak için çok kısa bir ses kaydı süresi yeterli oluyor. Özellikle ses üreticisi kamuoyuna serbest bırakılırsa, milyonlarca insanın teknolojiye erişimi olduğunda bunu kontrol etmek gerçekten zor olacaktır. Dahası, yargılamalarda ses kayıt kanıtları da geçersiz kılınabilir; çünkü bu durumla, ses dosyasının sahte olduğu veya bozulduğu savunulabilir.



Bununla birlikte, konuşma sentezi şu an istenilen amaç da değildir. Lyrebird kurucuları, ünlü seslerle kitap okumak gibi kişisel bir yardım olarak teknolojiyi olumlu bir şekilde uygulamak istiyorlar. Ayrıca konuşma senteziyle konuşmalarına yardımcı olması için engelli insanlar için de yardımı olacağı hedeflenmiştir. Bunun en ünlü bir örneği, Stephen Hawking'in kullandığı bilgisayar sesidir.
Lyrebird teknolojisi hala geliştirilmektedir. İlgilenen kişiler, beta-test kullanıcısı olmak veya bilgilendirilmek üzere yeni web sitesine abone olabilirler.


Kaynak:


interestingengineering
 
ZAFER AKGÜL ZAFER AKGÜL Yazar Hakkında Tüm yazıları Mesaj gönder Yazdır



ANKET
Endüstri 4.0 için En Hazır Sektör Hangisidir

Sonuçlar
Aktif etkinlik bulunmamaktadır.