Нейробиологи из Технического университета Дрездена смогли доказать, что распознавание речи у людей начинается с сенсорных путей от уха до коры головного мозга, а не исключительно в самой коре головного мозга, как предполагалось ранее.
Во многих семьях невозможно представить жизнь без языковых помощников – они включают или выключают устройства, сообщают новости со всего мира или знают, какой будет погода завтра. Распознавание речи этих систем в основном основано на машинном обучении, ветви искусственного интеллекта. Машина генерирует свои знания из повторяющихся шаблонов данных. В последние годы использование искусственных нейронных сетей в значительной степени улучшило компьютерное распознавание речи.
Однако для нейробиолога профессора Катарины фон Кригштейн из Дрезденского технического университета человеческий мозг остается "самая замечательная машина для обработки речи." "Он работает намного лучше, чем компьютерная обработка речи, и, вероятно, так будет работать еще долгое время," комментирует профессор фон Кригштейн, "потому что точные процессы обработки речи в мозгу до сих пор в значительной степени неизвестны."
В недавнем исследовании нейробиолог из Дрездена и ее команда обнаружили еще один строительный блок в загадке обработки речи человека. В исследовании 33 испытуемых были обследованы с помощью функциональной магнитно-резонансной томографии (МРТ). Испытуемые получали речевые сигналы от разных динамиков. Им предлагалось выполнить речевое задание или контрольное задание на распознавание голоса в случайном порядке. Команда ученых зафиксировала мозговую активность испытуемых во время эксперимента с помощью МРТ. Оценка записей показала, что структура в левом слуховом проходе – вентральное медиальное коленчатое тело (vMGB) – имеет особенно высокую активность, когда испытуемые выполняют речевую задачу (в отличие от контрольной) и когда испытуемые особенно хорошо распознают речь.
Ранее предполагалось, что вся слуховая информация в равной степени передается по слуховым путям от уха до коры головного мозга. Текущие записи повышенной активности vMGB показывают, что обработка слуховой информации начинается до того, как слуховые пути достигают коры головного мозга. Катарина фон Кригштейн объясняет результаты следующим образом: "В течение некоторого времени у нас были первые признаки того, что слуховые пути более специализированы в речи, чем предполагалось ранее. Это исследование показывает, что это действительно так: часть vMGB, которая передает информацию от уха к коре головного мозга, обрабатывает слуховую информацию иначе, когда нужно распознавать речь, чем когда должны распознаваться другие компоненты коммуникативных сигналов, такие как голос говорящего например."
Распознавание слуховой речи имеет огромное значение для межличностного общения. Понимание основных нейронных процессов будет важно не только для дальнейшего развития компьютерного распознавания речи.
Эти новые результаты также могут иметь отношение к некоторым симптомам дислексии развития. Известно, что левое МГБ у людей с дислексией работает иначе, чем у других. Специализация левого MGB в речи может объяснить, почему люди с дислексией часто испытывают трудности с пониманием речевых сигналов в шумной обстановке (например, в ресторанах). Катарина фон Кригштейн и ее команда теперь собираются провести дальнейшие исследования, чтобы научно подтвердить эти показания.