DERHAL YAYINLANACAKTIR No. 3259

Bu metin söz konusu basın bülteninin resmi İngilizce versiyonunun çevirisidir. Yalnızca referans olması ve kolaylık sağlaması amacıyla hazırlanmıştır. Ayrıntılar ve/veya özellikler için lütfen orijinal İngilizce metne başvurun. Herhangi bir tutarsızlık durumunda orijinal İngilizce versiyonun içeriği geçerlidir.

Mitsubishi Electric Konuşulan Dili Otomatik Olarak Tespit Eden Çok Dilli Konuşma Tanıma Teknolojisini Geliştirdi

Birden fazla insanın aynı anda konuştuğu ortamlarda dahi konuşulan dilleri eşzamanlı olarak belirlemek ve anlamak için şirketin Maisart kompakt AI’sını kullanarak farklı durumlara uygun konuşma arayüzlerinin hayata geçirilmesine yardımcı olacak

PDF Version (PDF:479KB)

TOKYO, 13 Şubat 2019 Mitsubishi Electric Corporation (TOKYO: 6503) bugün dünyada bir ilk olduğuna inanılan ve hangi dilin konuşulduğu belirtilmeden yüksek isabetle çok dilde konuşma tanıma özelliğini taşıyan bir teknoloji geliştirdiğini açıkladı. Mükemmel Konuşma Tanıma (Seamless Speech Recognition) adı verilen yeni teknoloji, Mitsubishi Electric’in tescilli Maisart®* kompakt yapay zeka (AI) teknolojisi yardımıyla konuşulan dilleri eşzamanlı olarak tespit edebilen ve anlayan tek bir sisteme dayalı olarak geliştirildi. Tamamı düşük gürültülü ortamlarda olmak üzere 5 ve 10 dili içerecek şekilde yapılan testlerde, sistem hangi dilin konuşulduğu belirtilmeden sırasıyla %90’ın ve 80’in üzerinde başarı sağladı. Bu teknoloji eşzamanlı olarak aynı veya farklı dilleri konuşan birden fazla insanı da anlayabiliyor.

* Mitsubishi Electric’s AI creates the State-of-the-ARTin Technology

Mükemmel Konuşma Tanıma Teknolojisi

Mükemmel Konuşma Tanıma Teknolojisi

Mükemmel Konuşma Tanıma Teknolojisi’nde, Mitsubishi Electric’in benzersiz esneklik ve kesinlik sağlayan tescilli derin öğrenme metodunu kullanıldı. Derin bir ağın yalnızca giriş ve çıkış örnekleriyle eğitime tabi tutulduğu bir uçtan uca öğrenme çerçevesini kullanan teknoloji, sesbirim sistemleri ve telaffuz özellikleri gibi uzman bilgilerinden yararlanmak zorunda kalmadan konuşma dillerini eşzamanlı olarak tespit eden ve anlayan tek bir sistemin oluşturulmasına imkan tanıyor. Çok dilli konuşma verilerinin kullanıldığı eşzamanlı öğrenme isabet düzeyinin arttırılmasını sağlıyor.

Yeni sistemde uçtan uca konuşma tanıma için kullanılan Mitsubishi Electric’in tescilli Hibrit CTC/Dikkat Metodu, konuşma tanıma prosesinin hassasiyetinde ciddi ölçüde iyileşme sağlıyor. Uçtan uca konuşma tanıma için iki temsili yöntemle —bağlantıcı zamansal sınıflandırma (CTC) ve dikkate dayalı kod çözme—geliştirilen bu metot, söz konusu yöntemlerin avantajlarını desteklerken dezavantajlarını azaltıyor. Özellikle hibrit metot CTC’nin sisteme kaydedilen konuşma sinyalleri ile çıkış karakterleri arasındaki uyumu isabetli bir şekilde tahmin etme ve dikkate dayalı yöntemin konuşmanın akustik ve dilsel özellikleri arasındaki bağlantıları değerlendirme kabiliyetinden faydalanıyor.

Konuşma Tanıma Hassasiyeti

  Konuşma dili belirtilmeden çalışma özelliği 5 dil 10 dil
Yeni teknoloji Evet >%90 >%80
Konvansiyonel teknoloji** Hayır %87 %72
  • Not: İdeal kayıt ortamları varsayılarak gerçekleştirilmiştir.
  • ** Konuşulan dil öncesinde manüel seçim yapmak suretiyle her bir dil için ayrı ayrı oluşturulan ve kurgulanan birden fazla sistemin kombinasyonu

Konuşma tanıma teknolojisi, akıllı telefon gibi cihazların ve araç navigasyon sistemlerinin sesle çalıştırılmasına olanak sağlıyor. Ancak konvansiyonal konuşma tanıma sistemleri her bir dil için ayrıca geliştirildiği için kullanıcılar konuşmadan önce dil seçimi yapmak zorunda kalıyor. Konuşma tanıma öncesinde dil tespit yöntemi kullanılabilir ancak bu durumda dil tespit için harcanan süre nedeniyle sistemin kullanılabildiği süre azalırken, dil tespit hataları ile tek dilde yetersiz ölçüde verilerle desteklenen sub-optimal konuşma tanıma sistemleri nedeniyle tanıma hatalarında artış meydana gelir. Ayrıca, birden fazla konuşmacının aynı anda konuştuğu durumlarda konvansiyonel konuşma tanıma sistemlerinin kesinliği ciddi ölçüde etkilenir ve bu durumlarda uygulamada kısıtlamalar söz konusu olur.

Mitsubishi Electric’in Mükemmel Konuşma Tanıma Teknolojisi’nin farklı dilleri konuşan ve aynı aleti kullanan gruplar veya havalimanı terminalinin rehberlik sisteminde ana dilinde arama yapan yabancı yolcular gibi farklı durumlara uygun konuşma arayüzlerinin hayata geçirilmesine yardımcı olması bekleniyor. Gelecekte, Mitsubishi Electric otomatik konuşma tanıma teknolojisinin kesinliğini ve uygulanabilirliğini otomobiller, konutlar, kamu tesisleri ve daha birçok gerçek ortamda geliştirmek için çalışmalarını sürdürecek.

Haber içerikleri, yayınlandıkları tarihten sonra güncel olmayan bilgiler içerebilir ve/veya bildirimde bulunmadan değiştirilebilir.