Microsoft’un Yapay Zekası, Sesi Baz Alarak İnsan Yüzlerini Hareketlendiriyor

microsofts-logo-gets-a-makeover

 

Hemen hemen herkesin yüz hareketlerinin, konuşma ve ses klipleriyle senkronize edilebileceğini söyleyen Microsoft araştırmacıları, yapay zekayı kullanarak konuşan insan animasyonları üretmeye başladı.
Gelişen teknoloji, deepfake’in hiçbir zaman ortadan kalkmayacağının kanıtı olabilir. Çünkü Microsoft gibi dünyanın en önemli teknoloji şirketlerinden biri “deepfake” olarak adlandırmasa da yeni gelişmeyle bu alana adım atmış gibi duruyor. Üstelik Microsoft bu alanda tek değil.

Geçtiğimiz haziran ayında Samsung araştırmacıları da bir kişinin kaşlarını, ağzını, kirpiklerini ve yanaklarını birebir olarak canlandırabilen uçtan uca bir modeli ayrıntılarıyla anlatmışlardır. Bundan sadece birkaç hafta sonra Udacity, ses anlatımından ders videolarını otomatik olarak üreten bir sistemi tanıtmıştı. İki yıl önce de Carnegie Mellon araştırmacıları yüz hareketlerini bir kişiden diğerine aktarabilmeye imkan veren yaklaşımı açıklayan bir bildiri yayınlamışlardı.

microsoft

Microsoft Araştırma ekibi, bunlara ve diğer çalışmalara dayanarak, ses odaklı konuşan kafa animasyonlarının kalitesini artırdığını iddia ettikleri bir teknik ortaya koydu. Önceki insan kafası oluşturma yaklaşımları, nötr bir tonda temiz ve nispeten gürültüsüz bir ses gerektiriyordu. Ancak araştırmacılar yeni araştırmayla birlikte, ses dizilerini fonetik içerik ve arka plan gürültüsü gibi faktörlere ayıran yöntemlerinin gürültülü ve duygusal açıdan zengin veri örneklerini genelleştirebileceğini söylüyorlar.
Önerilen tekniğin altında, gizli gösterimleri öğrenen değişken bir otomatik kodlayıcı (VAE) bulunuyor. Giriş ses dizileri, VAE tarafından içeriği, duyguyu ve diğer varyasyon faktörlerini kodlayan farklı gösterimlere dönüştürülüyor. Giriş sesine dayanarak, yüzden harekete geçmek için giriş yüz görüntüleri ile birlikte bir video üretecine beslenen dağıtımdan bir dizi içerik gösterimi örnekleniyor. Böylelikle o yüze uygun olabilecek olası bir ses çıkıyor.

Leave a Reply

Your email address will not be published. Required fields are marked *

You may use these HTML tags and attributes: <a href="" title=""> <abbr title=""> <acronym title=""> <b> <blockquote cite=""> <cite> <code> <del datetime=""> <em> <i> <q cite=""> <strike> <strong>