Google sesleri ayıran yapay zeka

Google, Kalabalık Ortamdaki Sesleri Ayrıştıracak Yapay Zeka Geliştirdi

Google araştırma mühendisleri, kalabalık ortamlarda kaydedilen görsel ve işitsel verileri kullanarak sesleri ayrıştırabilen bir yapay zeka (AI) sistemi geliştirdi. Tasarlanan bu yeni teknoloji, insan beyninin kalabalık bir ortamdaki sesleri izole ederek, duymak istediği sese odaklanması mantığına dayanan “kokteyl partisi etkisi”ne dayanıyor.

Google’ın bu yapay zekası, hem video, hem de ses verileriyle aynı anda çalışmak üzere tasarlanmış. Arama devinin, bu teknolojiyi oluşturmak için Youtube‘da yer alan 100 binden fazla yüksek kaliteli videoyu kullandığı açıklanırken, yapay zekaya tüm konuşmaların minimum arka plan gürültüsü ve tek bir hoparlörden verildiği belirtiliyor.

Araştırmacılar, bir sonraki adımda ise yapay zekayı ileri seviyeye taşımak için, seslerin birbirinden ayrıştırılmasını zorlaştıracak dış konuşmaların sisteme eklendiğini açıklıyorlar. Sonucun ise oldukça başarılı olduğunu belirten yetkililer, kalabalık ortamdaki seslerin izole edilerek, odaklanılacak sesin ön plana çıkarılmasının tek şartının, konuşan kişinin yüzünün ekranda görülmesi olduğunu söylüyorlar. Google’ın bu sesleri ayrıştıran bu yapay zeka teknolojisini, bazı servislerine entegre etmeyi planladığı da gelen bilgiler arasında.

Leave a comment