Ученые Duke и Массачусетского технологического института обнаружили область мозга, которая чувствительна к времени речи, что является важным элементом разговорной речи.
Время имеет значение для структуры человеческой речи. Например, фонемы – это самая короткая, самая базовая единица речи и длятся в среднем от 30 до 60 миллисекунд. Для сравнения, слоги занимают больше времени: от 200 до 300 миллисекунд. Большинство целых слов еще длиннее.
Чтобы понимать речь, мозгу нужно как-то интегрировать эту быстро развивающуюся информацию.
Слуховая система, как и другие сенсорные системы, вероятно, использует кратчайшие пути, чтобы справиться с натиском информации – например, отбирая информацию в кусках, аналогичных по длине среднему согласному или слогу, говорит соавтор исследования Тобиас Оверат, один из авторов исследования. доцент кафедры психологии и неврологии в Duke. Другой автор-корреспондент – Джош Макдермотт из Массачусетского технологического института.
В исследовании, опубликованном 18 мая в журнале Nature Neuroscience, Оверат и его сотрудники разрезали записи иностранной речи на короткие фрагменты продолжительностью от 30 до 960 миллисекунд, а затем собрали фрагменты, используя новый алгоритм для создания новых звуков, которые авторы называют ‘лоскутные одеяла’.
Чем короче фрагменты результирующих речевых лоскутов, тем сильнее нарушалась исходная структура речи.
Чтобы измерить активность нейронов в реальном времени, ученые разыграли речевые лоскутные одеяла для изучения участников, сканируя их мозг на функциональном аппарате магнитно-резонансной томографии. Команда предположила, что области мозга, участвующие в обработке речи, будут более активно реагировать на речевые лоскутные одеяла, состоящие из более длинных сегментов.
Действительно, область мозга, называемая верхней височной бороздой (STS), стала очень активной во время лоскутных одеял продолжительностью 480 и 960 миллисекунд по сравнению с лоскутными одеялами продолжительностью 30 миллисекунд.
Напротив, другие области мозга, участвующие в обработке звука, не изменили своей реакции в результате различий в звуковых квилтах.
"Это было довольно интересно. Мы знали, что были на чем-то," – сказал Оверат, сотрудник Duke Institute for Brain Sciences
Известно, что верхняя височная борозда объединяет слуховую и другую сенсорную информацию. Но никто не показал, что СТС чувствительна к временным структурам речи.
Чтобы исключить другие объяснения активации STS, исследователи протестировали множество управляющих звуков, которые они создали для имитации речи. Один из созданных ими синтетических звуков имел частоту речи, но не имел ритмов. Другой удалил всю высоту из речи. Третья использовала звуки окружающей среды.
Они стегали каждый из этих контрольных стимулов, измельчая их на 30- или 960-миллисекундные части и сшивая их вместе, прежде чем воспроизводить их участникам. Похоже, что STS не реагировал на манипуляции с квилтингом, когда его применяли к этим контрольным звукам.
"Мы действительно сделали все возможное, чтобы убедиться, что эффект, который мы наблюдаем в STS, был вызван обработкой речи, а не каким-либо другим объяснением, например, высотой звука или естественным звуком, в отличие от какого-то компьютера. -сгенерированный звук," Оверат сказал.
Группа планирует изучить, похож ли ответ в STS для иностранной речи, которая фонетически сильно отличается от английской, такой как мандарин, или лоскутных одеял знакомой речи, которая является понятной и имеет значение. Для знакомой речи они могут увидеть более сильную активацию в левой части мозга, которая считается доминирующей в обработке речи.