Yapay zeka insanların sesini dinledi sonra yüzlerini oluşturdu

Hiç sesine dayanarak, daha önce görmediğiniz bir kişinin zihinsel görüntüsünü oluşturdunuz mu? Yapay zeka (AI) artık bunu yapabilir, referans olarak kişinin sadece kısa bir ses klibi kullanılarak yüzünün dijital görüntüsü oluşturuluyor. Bilim insanları tarafından Speech 2 Face diye adlandırılan, sinir ağı insan beynine benzer bir şekilde “düşünen bir bilgisayar”, 100.000 ‘den fazla farklı insanın konuştuğunu gösteren milyonlarca eğitim videosu ile eğitildi. Bu veri kümesinden Speech 2 Face vokal ipuçları ile insan yüzündeki belirli fiziksel özellikler arasındaki ilişkileri öğrendi. Yapay zeka daha sonra sese uyan fotogerçekçi bir yüz modellemek için bir ses klibi kullandı.

Neyse ki, yapay zeka henüz belirli bir bireyin yalnızca sesini temel alarak neye benzediğini tam olarak bilmiyor. Çalışmanın yazarları, sinir ağının cinsiyet, yaş ve etnik kökene dikkat çeken, birçok kişi tarafından paylaşılan özellikleri gösteren konuşmadaki bazı belirleyicileri tanıdığını belirtti. Bilim insanları, “Model, yalnızca ortalama görünüşlü yüzler üretecek” dedi. “Belirli kişilerin imajlarını üretmeyecek.” Speech 2 Face tarafından üretilen yüzler hepsi nötr ifadelere sahip, seslerin arkasındaki insanlarla tam olarak eşleşmedi. Ancak görüntüler, araştırmaya göre genellikle bireylerin doğru yaş aralıklarını, etnik kökenlerini ve cinsiyetlerini yakaladı.

Ancak, algoritmanın yorumları mükemmel olmaktan uzaktı. Speech 2 Face, dil değişkenleriyle karşılaştığında “karma performans” sergilemiştir. Örneğin, yapay zeka , Çince konuşan bir Asyalı adamın ses klibini dinlediğinde, program bir Asya yüzünün görüntüsünü oluşturuyordu. Bununla birlikte, aynı adam İngilizce’de farklı bir ses klibinde konuştuğunda, yapay zeka beyaz bir adamın yüzünü yarattığını bildirdi. Algoritma ayrıca, düşük tiz sesleri erkek yüzlerle ve yüksek tiz sesleri kadın yüzleriyle birleştiren cinsiyet yanlılığı gösterdi.Araştırmacılar, eğitim veri seti yalnızca YouTube ’dan gelen eğitim videolarını temsil ettiğinden, “tüm dünya nüfusunu eşit şekilde temsil etmiyor” dedi. Araştırmacılar, bu video veri setiyle ilgili bir başka kaygının, bir YouTube videosunda yer alan bir kişinin, benzerliğinin çalışmaya dahil edildiğini öğrenmeye çalışmasıyla ortaya çıktığını belirtti.
Editör / Yazar: Burcu AKIN
Kaynak: https://www.livescience.com/65689-ai-human-voice-face.html

Bir cevap yazın

Avatar photo

E-posta hesabınız yayımlanmayacak.

    Donör Kanını Evrensel Bir Kana Dönüştürmenin Bir Yolunu Bulduk

    Gombe Şempanze Savaşları 1974-1978