иканська компанія Sensory Inc. розробила інтегральну схему Voice Direct ™ 364 здійснює дікторозавісімое розпізнавання невеликого числа команд (близько 60) після попереднього навчання [20] . Перед початком експлуатації модуль необхідно навчити всім командам, використовуваним в роботі. Команди зберігаються в зовнішню пам'ять у вигляді образів розміром 128 байт. Під час роботи, образ чергової команди порівнюється з еталонними з пам'яті в нейромережевому модулі і приймається рішення про збіг.
Тайванська технологічна корпорація Primestar Technology Corporation розробила власний чіп VP - 2025, призначений для мовного розпізнавання [21] . Даний пристрій здійснює розпізнавання за допомогою нейромережевого методу.
Крім того, американськими вченими прийнято рішення створити спеціалізований мікропроцесор для розпізнавання мови. Дослідження в даному напрямку будуть проводитися співробітниками Університету Карнегі-Меллон у Пітсбурзі (Пенсільванія) і Каліфорнійського університету в Берклі. Очікується, що новий мікропроцесор з'явиться протягом найближчих двох-трьох років. Причому ефективність розпізнавання мови таким чіпом повинна буде в 100-1000 разів перевищити аналогічний показник застосовуються сьогодні програмно-апаратних комплексів [22] .
6. Теоретичні дослідження і розробки
Розробкою теоретичної бази в області мовних технологій займаються безліч дослідницьких груп по всьому світу. У першу чергу це такі великі корпорації як IBM, Intel, Microsoft, AT & T. Ці компанії займаються теорією розпізнавання вже не один десяток років і є законодавцями в цій області.
З усього розмаїття наукових розробок детально розглянемо роботи вітчизняних дослідницьких груп.
У лабораторії автоматизованих систем масового обслуговування Інституту проблем управління РАН більше 30 років ведуться дослідження в галузі мовного розпізнавання. Головним науковим і практичним напрямком діяльності лабораторії в даний час є застосування комп'ютерного розпізнавання злитого мовлення в системах обслуговування населення з можливістю використання російської та інших мов [23] . Розроблено математичні моделі для опису процесів в системах розпізнавання мови.
Інститут системного аналізу РАН [24] займається роботами в області розпізнавання мови, які орієнтовані на вирішення наступних завдань: розвиток теоретичної бази, розробка і програмна реалізація методів автоматичного аналізу мовних сигналів в реальному часі, що дозволяють підвищити якість систем синтезу , розпізнавання і кодування мови. Принципова новизна запропонованих рішень полягає у використанні острівної нейросетевого аналізу мовного сигналу в кореляції з виділенням стійких ознак і застосуванні фонологічних та інших «інженерних» знань (тобто знань, заснованих на змістовному дослідженні процесу виголошення або процесу сприйняття) про тонку структурі мовного сигналу. p>
Розробки «Істра-Софт» [25] в області мовних технологій включають в себе такі основні напрямки: стиснення мовних файлів, розпізнавання мови, синтез мови за текстом, ідентифікація особи по голосу. Був розроблений алгоритм виділення фонем з злитий мови в реальному часі. Алгоритм виробляє адаптивний аналіз параметрів звукової інформації та відділення параметрів голосової щілини від параметрів артикуляційного фільтра, виділяє параметри сигналу, які сприймаються як певний звук (фонема), ...