Konuşma tanıma teknolojisi, akıllı telefon üzere aygıtların ve araç navigasyon sistemlerinin sesle çalıştırılmasına imkan sağlıyor. Lakin konvansiyonel konuşma tanıma sistemleri her bir lisan için ayrıyeten geliştirildiğinden, kullanıcılar konuşmadan evvel lisan seçimi yapmak zorunda kalıyor. Hasebiyle mevcut sistemlerde hem lisan tespiti için ek bir mühlet harcanması gerekiyor hem de birden fazla konuşmacının tıpkı anda konuştuğu durumlarda sistemin katılığı önemli ölçüde etkileniyor. Tüm bu problemlere tahlil sunmayı hedefleyen Japon devi Mitsubishi Electric, tescilli Maisart kompakt yapay zeka (AI) teknolojisi yardımıyla konuşulan lisanları eşzamanlı olarak tespit edebilen ve anlayan Kusursuz Konuşma Tanıma Teknolojisi’ni (Seamless Speech Recognition) geliştirdi.
5 lisanda yüzde 90 ve 10 lisanda yüzde 80 muvaffakiyet
Mükemmel Konuşma Tanıma Teknolojisi’nde, Mitsubishi Electric’in esneklik ve mutlaklık sağlayan tescilli derin öğrenme metodu kullanılıyor. Derin bir ağın sadece giriş ve çıkış örnekleriyle eğitime tabi tutulduğu bir uçtan uca öğrenme çerçevesini kullanan teknoloji, sesbirim sistemleri ve söylem özellikleri üzere uzman bilgilerinden yararlanmak zorunda kalmadan konuşma lisanlarını eşzamanlı olarak tespit eden ve anlayan tek bir sistemin oluşturulmasına imkan tanıyor. Bu sayede çok lisanlı konuşma bilgilerinin kullanıldığı eşzamanlı öğrenme isabet seviyesinin arttırılmasını sağlıyor. Tamamı düşük gürültülü ortamlarda olmak üzere 5 ve 10 lisanı içerecek biçimde yapılan testlerde, sistem hangi lisanın konuşulduğu belirtilmeden sırasıyla yüzde 90’ın ve yüzde 80’in üzerinde muvaffakiyet sağladı. Bu teknoloji eşzamanlı olarak birebir yahut farklı lisanları konuşan birden fazla insanı da anlayabiliyor.
Yeni sistemde uçtan uca konuşma tanıma için kullanılan Mitsubishi Electric’in tescilli Hibrit CTC/Dikkat Metodu, konuşma tanıma prosesinin hassasiyetinde önemli ölçüde güzelleşme sağlıyor. Uçtan uca konuşma tanıma için ilişkici zamansal sınıflandırma (CTC) ve dikkate dayalı kod çözme formundaki iki temsili formülle geliştirilen bu metot, kelam konusu sistemlerin avantajlarını desteklerken dezavantajlarını azaltıyor. Bilhassa hibrit metot CTC’nin sisteme kaydedilen konuşma sinyalleri ile çıkış karakterleri ortasındaki ahengi, isabetli bir halde iddia etme ve dikkate dayalı usulün konuşmanın akustik ve dilsel özellikleri ortasındaki kontakları kıymetlendirme kabiliyetinden faydalanıyor.
Otomobiller, konutlar, kamu tesisleri üzere ortamlar için de geliştirilecek
Mükemmel Konuşma Tanıma Teknolojisi’nin farklı lisanları konuşan ve birebir aygıtı kullanan kümeler yahut havalimanı terminalinin rehberlik sisteminde ana lisanında arama yapan yabancı yolcular üzere farklı durumlara uygun konuşma arayüzlerinin hayata geçirilmesine yardımcı olması bekleniyor. Mitsubishi Electric otomatik konuşma tanıma teknolojisinin katılığını ve uygulanabilirliğini arabalar, konutlar, kamu tesisleri ve daha birçok gerçek ortamda geliştirmek için çalışmalarını sürdürmeyi hedefliyor.