‘Evrensel çevirmen’ dublaj yapar ve hoparlörleri dudak senkronizasyonu yapar – ancak Google kötüye kullanıma karşı uyarır

Google, videoyu yeni bir dilde yayınlarken aynı zamanda konuşmacının dudaklarını hiç konuşmadıkları kelimelerle senkronize eden güçlü ve yeni bir çeviri hizmetini test ediyor. Pek çok nedenden dolayı çok yararlı olabilir, ancak şirket kötüye kullanım olasılığı ve bunu önlemek için atılan adımlar konusunda açık sözlüydü.

“Evrensel Tercüman” Google I/O’da gösterildi şirketin yeni “Teknoloji ve Toplum” departmanının başkanı James Manyika tarafından yapılan bir sunum sırasında. Yapay zekadaki gelişmelerle ancak yakın zamanda mümkün kılınan, ancak aynı zamanda en baştan hesaba katılması gereken ciddi riskler sunan bir şeyin örneği olarak sunuldu.

“Deneysel” hizmet, bir giriş videosunu alır, bu durumda çevrimiçi bir kurstan orijinal olarak İngilizce kaydedilmiş bir derstir, konuşmayı yazıya döker, çevirir, konuşmayı o dilde yeniden oluşturur (stil ve ton eşleştirme) ve ardından videoyu bu şekilde düzenler. konuşmacının dudaklarının yeni sesle daha yakından eşleşmesi.

Yani temelde bir derin sahte jeneratör, değil mi? Evet, ancak başka yerlerde kötü amaçlarla kullanılan teknolojinin gerçek bir faydası var. Aslında şu anda medya dünyasında bu tür şeyleri yapan, bir düzine nedenden herhangi biri için post prodüksiyonda satırları yeniden yayınlayan şirketler var. (Demo etkileyiciydi, ancak teknolojinin hala gitmesi gereken bir yolu olduğu söylenmelidir.)

Ancak bu araçlar, YouTube yükleme sayfasında bir onay kutusu olarak değil, katı bir medya iş akışında kullanıma sunulan profesyonel araçlardır. Universal Translator da – henüz – değil, ancak böyle olacaksa, Google’ın dezenformasyon veya diğer öngörülemeyen tehlikeler yaratmak için kullanılma olasılığını hesaba katması gerekiyor.

Manyika bunu “cesaret ve güvenlik arasındaki gerilim” olarak adlandırdı ve bir denge kurmak zor olabilir. Ancak açıkça görülüyor ki, herhangi bir kısıtlama olmaksızın herkesin kullanması için geniş çapta yayınlanamaz. Yine de faydaları – örneğin, altyazı veya yeniden kayıt olmadan 20 dilde çevrimiçi bir kurs sağlamak – inkar edilemez.

Manyika, “Bu, anlamayı öğrenmek için çok büyük bir adım ve kurs tamamlama oranlarında umut verici sonuçlar görüyoruz” dedi. “Ancak burada içsel bir gerilim var: Altta yatan aynı teknolojinin bir kısmı, kötü aktörler tarafından derin sahtekarlıklar oluşturmak için kötüye kullanılabilir. Bu nedenle, kötüye kullanımı önlemek için hizmeti korkuluklarla oluşturduk ve yalnızca yetkili iş ortaklarının erişimine açtık. Yakında yanlış bilgi sorununa da yardımcı olmak için filigranlamadaki yeni yenilikleri en son üretken modellerimize entegre edeceğiz.”

Bu kesinlikle bir başlangıç, ancak iş bu tür barikatları aşmaya geldiğinde aynı kötü aktörlerin ne kadar yetenekli olduklarını gördük. “Korkuluklar” biraz dalgalıdır ve yalnızca ortaklarla paylaşmak, yalnızca model sızıntı yapmadığı sürece işe yarar – ki bu eğilimdedir. Filigranlama da elbette izlenecek iyi bir yoldur, ancak şimdiye kadar buna yönelik yaklaşımların çoğu, filigranlı medyaya yapılan kırpma, yeniden boyutlandırma ve diğer küçük manipülasyonlar gibi önemsiz düzenlemelerle yenilgiye uğratıldı.

Google bugün hem yeni hem de tanıdık birçok AI yeteneği gösterdi, ancak bunların hem yararlı hem de güvenli olup olmayacağı ve nasıl olacağı hala bir muamma. Ancak Manyika (kendisi de bir araştırmacı) gibi birine en büyük etkinliğinde “vay canına, bu kötü olabilir, bu yüzden şunu ve bunu yapıyoruz, işe yarayıp yaramayacağını kim bilebilir” demesi için sahne süresi vermek en azından oldukça dürüst bir yaklaşımdır. sorun.

TechCrunch'ta Google I/O 2023 hakkında daha fazlasını okuyun

kim kimdir ne zaman nasıl nelerdir nedir ne işe yarar tüm bilgiler
dünyadan ilginç ve değişik haberler en garip haberler burada

Yorum yapın