Xiaomi, Konuşma Bozukluğu Olan Kişilere Yardım Etmek İçin Kendi Geliştirdiği Konuşma Teknolojisini Kullanıyor
“Own My Voice” projesi, konuşma bozukluğu olanların benzersiz ve özelleştirilmiş seslere sahip olmalarına olanak tanıyor.
IoT platformu ile bağlanan akıllı telefonlar ve donanımlar geliştiren tüketici elektroniği ve akıllı üretim şirketi olan Xiaomi, erişilebilirlik alanına yönelik geliştirdiği ileri düzey algoritma uygulamasını ve konuşma teknolojisini tanıttı. Xiaomi AI Lab’ın geliştirdiği spontane tarzındaki Metin Okuma teknolojisi, konuşma bozukluğu olan kişiler için benzersiz ve özelleştirilmiş bir ses üretiyor.
Konuşma bozukluğu çeken kişiler, monoton bir elektronik ses yerine “kendi seslerini” kullanarak başkalarıyla iletişim kurabiliyor. Xiaomi Teknik Komitesi tarafından yönetilen “Own My Voice” ön araştırma projesinin bir parçası olan bu başarılı girişim, Xiaomi’nin “İyilik için teknolojiye bağlılığını” ve “Dünya genelinde herkesin yenilikçi teknolojiler aracılığıyla daha iyi bir yaşam sürmesine olanak tanıma” misyonunu gerçekleştirmeye yönelik kararlılığını gösteriyor.
Xiaomi neden bu projeyi başlattı?
İnsanları önemseyen Xiaomi, teknoloji inovasyonlarıyla insanların farklı ihtiyaçlarını karşılamaya çalışıyor. Konuşma bozukluğu olan birçok kişinin günlük iletişimde benzersiz seslere sahip olma isteğini gören Xiaomi, kullanıcıların kendi seslerine sahip olmaları için “Own My Voice” proje ekibini kurdu. Xiaomi Corporation Teknoloji Komitesi İyilik için Teknoloji Organizatörü Zhu Xi, “Kişilerin taleplerine karşılık vermek gibi teknoloji inovasyonlarının bize sağladığı birçok değeri keşfetmekten büyük heyecan duyuyoruz” dedi.
Xiaomi projeyi nasıl hayata geçirdi?
Xiaomi, konuşma bozukluğu çeken kişi için en uygun ve kişiselleştirilmiş sesin oluşturulabilmesi adına şirket bünyesinde 200’den fazla gönüllüyle birlikte çalıştı. Gönüllülerin bağışladığı seslerin özelliklerini konuşma bozukluğu çeken kişilerin sesleriyle eşleştirmek için ses izi eşleştirme algoritması kullanıldı. Bu yaklaşımla, konuşma bozukluğu çeken kişinin ses referansının temel sesi olarak en uygun ses bulundu. Kişiselleştirme ve kişisel gizlilik göz önünde bulundurularak seçilen gerçek ses, yeni ve orijinal bir ses oluşturmak için karmaşık bir akustik modifikasyonla manipüle edildi.
Daha sonra, yapay zeka modelini eğitmek için spontane tarzda metin okuma teknolojisi kullanılarak, yeni sesin kademeli olarak bir insanın duygularını ve tonunu doğru bir şekilde ifade edebilen doğal bir ritim ve tonlama kazanması sağlandı.
“Own My Voice” projesi, sentezlenen sesin özgünlüğünü, güvenliğini ve son derece özgün olmasını sağlamak için Xiaomi’nin kendi geliştirdiği konuşma teknolojisini bir araya getirerek konuşma bozukluğu olan kişiler için kişiselleştirilmiş konuşma sentezi konusunda bir çığır açıyor.
Proje neden önemli?
Projenin omurgasını, Xiaomi AI Lab bünyesinde çalışan bir grup konuşma teknolojisi uzmanı oluşturuyor. 2017’den bu yana, Uluslararası Akustik, Konuşma ve Sinyal İşleme Konferansı (ICASSP) gibi en iyi uluslararası konferanslarda konuşma üzerine 37 bildiri yayınladılar. “Own My Voice” projesinin başarısı, esas olarak bu uzmanlar tarafından geliştirilen spontane tarzında Metin Okuma teknolojisine bağlı.
Spontane tarzda Metin Okuma teknolojisi, sentezlenen sesi tonlama, duraklatma, hız ve diğer özellikler bağlamında gerçek bir insan sesi haline getiriyor. bu, elektronik sesin monoton ve doğal olmayan hissini daha doğal bir sesle değiştiriyor. Şu an bu teknoloji, Xiaomi’nin yapay zeka destekli sesli asistanı Xiaoai ile donatılan birçok akıllı cihazda kullanılıyor. “Own My Voice” projesi, spontane tarzdaki Metin Okuma teknolojisinin erişilebilirlik alanlarında geniş çapta benimsenebileceğini ve kullanıcı deneyimini iyileştirebileceğini gösteriyor.
Zhu Xi, “Azınlık gruplarının ihtiyaçlarını erken bir aşamada fark edip karşılarsak, teknolojinin yayılma süreci önemli ölçüde kısalabilir. Bu, yeni teknolojilerin faydalarının özel ihtiyaçları olan kişiler için gecikme olmadan erişilebilir olmasına olanak tanır” dedi.
Xiaomi, ilerleyen süreçte konuşma bozukluğu yaşayan kişilerden geri bildirim almaya devam edecek ve bu projenin fizibilitesini daha geniş bir aralıkta inceleyecek. Xiaomi, teknolojik yeniliklerle insanların farklı ihtiyaçlarını karşılamaya çalışarak, en son teknolojiyle erişilebilirliği güçlendirmeye devam edecek.