Yalnızca 2,2 MB boyutuyla Google’ın yeni konuşma filtreleme teknolojisi, mobil uygulamalar için mükemmel
Google’ın şu andaki tüm telefonlarında Google Asistan’dan Google Çeviri’ye ve hatta Pixel’in şık kaydedici uygulamasına kadar konuşma algılamasını kullanan birçok uygulama bulunuyor. Ancak, bu uygulamaların karşılaştığı zorluklardan biri, sesinizi diğer insanlardan veya arka plan gürültüsünden ayırmaktır.
Bu zorlukların üstesinden gelmek için Google’ın yapay zeka ekibi, VoiceFilter-lite adlı yeni bir hafif model oluşturdu. 2018 yılında ekip, şirketin ses eşleştirme teknolojisini kullanan ilk VoiceFilter modelini ortaya çıkarmış ve bir hizmete kaydolduğunuzda konuşmanızı ve sesi analiz etmek için Google Asistan’da kullanmaya başlamıştır.
Çoğu zaman sesleri verimli bir şekilde tanımak aslında büyük boyutlu ve belirgin CPU ve Pil Tüketimi gerektiren bir durumdur. Görünen o ki Google Yapay Zeka ekibi bu soruna bir çözüm buldu bile…
Google ekibi, yalnızca 2,2 MB boyutunda olan VoiceFilter-lite modelini geliştirdi ve bu modeli tonlarca hafif mobil uygulama için uygun hale getirdi. Yeni teknoloji bir kullanıcının halihazırda kayıtlı sesini kullanıyor ve örtüşen konuşma olduğunda bile tanımayı daha iyi hale getiriyor.
Bu modelin bir avantajı da onu konuşma tanıma modelinize dahil etmenize gerek olmamasıdır. Dolayısıyla, bir konuşmacının sesi daha önce kaydedilmemişse, uygulamanız VoiceFilter-Lite’ı atlayabilir ve tanıma komutlarıyla devam edebilir. Bu, kayıtlı bir kullanıcının gizli modda bir dijital asistana bazı komutlar vermek istemesi durumunda da yardımcı olur.
Bundan sonraki adım ise İngilizce dışındaki diller içinde bunu geliştirmek olacak. Buna ek olarak; doğrudan konuşma tanımayı geliştirmek istiyorlar, böylece model, örtüşen konuşmalardan gelen sesleri tanımaktan daha fazlası için kullanılabilir.
Yeni VoiceFilter-lite için detaylar ise burada