К сожалению, много поведенческих голосовых беспорядков не хорошо поняты. В частности, пациенты с дисфонией мышечного напряжения (MTD) часто испытывают ухудшающееся голосовое качество и вокальную усталость («усталый голос») в отсутствие любого ясного повреждения голосовых связок или других проблем со здоровьем, который делает условие и трудно чтобы диагностировать и трудно рассматривать.Но команда из Лаборатории Информатики и Искусственного интеллекта MIT (CSAIL) и Центральной больницы Массачусетса (MGH) полагает, что лучше понимание условий как MTD возможно через машинное обучение.
Используя данные об акселерометре, собранные от носимого устройства, разработанного исследователями в Голосовом Центре MGH, исследователи продемонстрировали, что они могут обнаружить различия между предметами с MTD и подобранными средствами управления. Те же самые методы также показали, что после получения голосовой терапии MTD подвергает показанное поведение, которое было более подобно тем из средств управления.
«Мы полагаем, что этот подход мог помочь обнаружить беспорядки, которые усилены вокальным неправильным употреблением и помогают опытным путем измерить воздействие голосовой терапии», говорит доктор философии MIT студент Марзиех Гэссеми, который является первым автором на связанной бумаге, что она представила наконец Машинное обучение недели в Здравоохранении (MLHC) конференция в Лос-Анджелесе. «Наша долгосрочная цель для такой системы, которая будет использоваться, чтобы предупредить пациентов, когда они используют свои голоса способами, которые могли привести к проблемам».Среди соавторов газеты преподаватель MIT Джон Гаттэг; Зишен Сайед, генеральный директор здоровья запуска машинного обучения [в] Scale; и доктор Роберт Хиллмен, доктор Дэрюш Мехта и доктор Джаррэд Х. ван Стэн из Центральной больницы Массачусетса.
Как это работаетСуществующие подходы к применению машинного обучения к физиологическим сигналам часто включают контролируемое изучение, в котором исследователи кропотливо маркируют данные и обеспечивают желаемую продукцию.
Помимо того, чтобы быть отнимающим много времени, такие методы в настоящее время не могут на самом деле помогать классифицировать произнесение как нормальное или неправильное, потому что в настоящее время есть не хорошее понимание корреляций между данными об акселерометре и голосовым неправильным употреблением.Поскольку команда CSAIL не знала, когда вокальное неправильное употребление происходило, они решили использовать безнадзорное изучение, где данные не маркированы на уровне случая.«Люди с вокальными беспорядками не всегда неправильно используют свои голоса, и люди без беспорядков также иногда неправильно используют свои голоса», говорит Гэссеми. «Трудная задача здесь состояла в том, чтобы построить алгоритм изучения, который может определить, какие движения голосовых связок видные в предметах с беспорядком».Исследование было сломано в две группы: пациенты, которые были диагностированы голосовые беспорядки и контрольную группу людей без беспорядков.
Каждая группа пошла об их ежедневных действиях, нося акселерометры на их шеях, которые захватили движения их вокальных сгибов.Исследователи тогда посмотрели на данные этих двух групп, анализируя больше чем 110 миллионов «глоттальных импульсов», что каждый представляет открытие того и закрытие вокальных сгибов. Сравнивая группы импульсов, команда могла обнаружить существенные различия между пациентами и средствами управления.Команда также нашла, что после голосовой терапии распределение глоттальных импульсов пациентов было более подобно тем из средств управления.
Согласно Guttag, это первое такое исследование, чтобы использовать машинное обучение, чтобы представить объективные свидетельства положительных эффектов голосовой терапии.«Когда пациент наталкивается на терапию, Вы могли бы только быть в состоянии проанализировать их голос в течение 20 или 30 минут, чтобы видеть то, что они делают неправильно и имеют их практика лучшие методы», говорит доктор Сьюзен Тибео, преподаватель в отделе хирургии в Медицинской школе Висконсинского университета и Здравоохранении, кто не был вовлечен в исследование. «Как только они уезжают, мы действительно не знаем, как хорошо они делают, и таким образом, захватывающе думать, что мы могли в конечном счете дать пациентам носимые устройства, которые используют круглосуточные данные, чтобы обеспечить более непосредственную обратную связь».
Смотрение впередОдна долгосрочная цель работы состоит в том, чтобы быть в состоянии использовать данные не только, чтобы улучшить жизни тех с голосовыми беспорядками, но потенциально помочь диагностировать определенные беспорядки.Команда также надеется далее исследовать основную причину, почему определенные виды вокальных импульсов более распространены у пациентов, чем в средствах управления.
«В конечном счете мы надеемся, что эта работа приведет к основанной на смартфоне биологической обратной связи», говорит Горец. «Такая технология может помочь с самым сложным аспектом голосовой терапии: то, чтобы заставлять пациентов на самом деле использовать более здоровые вокальные поведения, которые они изучили в терапии в их повседневных жизнях».