Xiaomi, erişilebilirlik alanına yönelik geliştirdiği ileri seviye algoritma uygulamasını ve konuşma teknolojisini tanıttı. Xiaomi AI Lab’ın geliştirdiği spontane üslubundaki Metin Okuma teknolojisi, konuşma bozukluğu olan şahıslar için eşsiz ve özelleştirilmiş bir ses üretiyor.
Konuşma bozukluğu çeken bireyler, monoton bir elektronik ses yerine “kendi seslerini” kullanarak diğerleriyle irtibat kurabiliyor. Xiaomi Teknik Komitesi tarafından yönetilen “Own My Voice” ön araştırma projesinin bir kesimi olan bu başarılı teşebbüs, Xiaomi’nin “İyilik için teknolojiye bağlılığını” ve “Dünya genelinde herkesin yenilikçi teknolojiler aracılığıyla daha uygun bir hayat sürmesine imkan tanıma” misyonunu gerçekleştirmeye yönelik kararlılığını gösteriyor.
İnsanları önemseyen Xiaomi, teknoloji inovasyonlarıyla insanların farklı gereksinimlerini karşılamaya çalışıyor. Konuşma bozukluğu olan birçok kişinin günlük bağlantıda eşsiz seslere sahip olma isteğini gören Xiaomi, kullanıcıların kendi seslerine sahip olmaları için “Own My Voice” proje grubunu kurdu. Xiaomi Corporation Teknoloji Komitesi Uygunluk için Teknoloji Organizatörü Zhu Xi, “Kişilerin taleplerine karşılık vermek üzere teknoloji inovasyonlarının bize sağladığı birçok bedeli keşfetmekten büyük heyecan duyuyoruz” dedi.
Xiaomi, konuşma bozukluğu çeken kişi için en uygun ve şahsileştirilmiş sesin oluşturulabilmesi ismine şirket bünyesinde 200’den fazla gönüllüyle birlikte çalıştı. Gönüllülerin bağışladığı seslerin özelliklerini konuşma bozukluğu çeken bireylerin sesleriyle eşleştirmek için ses izi eşleştirme algoritması kullanıldı. Bu yaklaşımla, konuşma bozukluğu çeken kişinin ses referansının temel sesi olarak en uygun ses bulundu. Şahsileştirme ve ferdî saklılık göz önünde bulundurularak seçilen gerçek ses, yeni ve orjinal bir ses oluşturmak için karmaşık bir akustik modifikasyonla manipüle edildi.
Daha sonra, yapay zeka modelini eğitmek için spontane biçimde metin okuma teknolojisi kullanılarak, yeni sesin kademeli olarak bir insanın hislerini ve tonunu hakikat bir formda söz edebilen doğal bir ritim ve tonlama kazanması sağlandı.
“Own My Voice” projesi, sentezlenen sesin özgünlüğünü, güvenliğini ve son derece özgün olmasını sağlamak için Xiaomi’nin kendi geliştirdiği konuşma teknolojisini bir ortaya getirerek konuşma bozukluğu olan bireyler için şahsileştirilmiş konuşma sentezi konusunda bir çığır açıyor.
Projenin omurgasını, Xiaomi AI Lab bünyesinde çalışan bir küme konuşma teknolojisi uzmanı oluşturuyor. 2017’den bu yana, Memleketler arası Akustik, Konuşma ve Sinyal Sürece Konferansı (ICASSP) üzere en âlâ memleketler arası konferanslarda konuşma üzerine 37 bildiri yayınladılar. “Own My Voice” projesinin başarısı, temel olarak bu uzmanlar tarafından geliştirilen spontane üslubunda Metin Okuma teknolojisine bağlı.
Spontane biçimde Metin Okuma teknolojisi, sentezlenen sesi tonlama, duraklatma, sürat ve öbür özellikler bağlamında gerçek bir insan sesi haline getiriyor. bu, elektronik sesin monoton ve doğal olmayan hissini daha doğal bir sesle değiştiriyor. Şu an bu teknoloji, Xiaomi’nin yapay zeka dayanaklı sesli asistanı Xiaoai ile donatılan birçok akıllı aygıtta kullanılıyor. “Own My Voice” projesi, spontane şekildeki Metin Okuma teknolojisinin erişilebilirlik alanlarında geniş çapta benimsenebileceğini ve kullanıcı tecrübesini güzelleştirebileceğini gösteriyor.
Zhu Xi, “Azınlık kümelerinin muhtaçlıklarını erken bir evrede fark edip karşılarsak, teknolojinin yayılma süreci değerli ölçüde kısalabilir. Bu, yeni teknolojilerin yararlarının özel muhtaçlıkları olan bireyler için gecikme olmadan erişilebilir olmasına imkan tanır” dedi.
Xiaomi, ilerleyen süreçte konuşma bozukluğu yaşayan şahıslardan geri bildirim almaya devam edecek ve bu projenin fizibilitesini daha geniş bir aralıkta inceleyecek. Xiaomi, teknolojik yeniliklerle insanların farklı gereksinimlerini karşılamaya çalışarak, en son teknolojiyle erişilebilirliği güçlendirmeye devam edecek.