Нови публикации
Гласът като анализ: Ранни сигнали за рак и доброкачествени лезии
Последно прегледани: 18.08.2025

Цялото съдържание на iLive е медицински прегледано или е проверено, за да се гарантира възможно най-голяма точност.
Имаме строги насоки за снабдяване и само свързваме реномирани медийни сайтове, академични изследователски институции и, когато е възможно, медицински проучвания, които се разглеждат от специалисти. Имайте предвид, че номерата в скоби ([1], [2] и т.н.) са линкове към тези проучвания.
Ако смятате, че някое от съдържанието ни е неточно, остаряло или под съмнение, моля, изберете го и натиснете Ctrl + Enter.

Изследователи от Университета за здраве и наука в Орегон анализираха речеви записи от новия публично достъпен набор от данни Bridge2AI-Voice и откриха проста акустична характеристика, която може да разкрие патология на гласните гънки. Говорим за съотношението хармоници-шум (HNR) - съотношението на „музикалните обертонове“ към шума. Неговото ниво и вариабилност отличават гласовете на хора с рак на ларинкса и доброкачествени лезии от здрави хора и някои други гласови нарушения. Ефектът е особено очевиден при цисгендър мъже; статистическата значимост не е достатъчна за жените - авторите обвиняват малкия размер на извадката и призовават за разширяване на данните. Работата е публикувана като кратък доклад във Frontiers in Digital Health.
Предистория на изследването
- Защо изобщо да търсим „гласови маркери“? Дрезгавостта е често срещано оплакване. Причините са разнообразни: от настинки и рефлукс до възли/полипи и рак на ларинкса. В момента пътят към диагнозата е посещение при УНГ специалист и ендоскопия (камера в носа/гърлото). Тя е точна, но не винаги е бързо достъпна и не е подходяща за домашно самонаблюдение. Необходим е предварителен скрининг: прост начин да се разбере кой трябва да посети лекар първо.
- Какво е гласов биомаркер? Речта е сигнал, който може лесно да бъде записан на телефон. Нейният „модел“ може да се използва за преценка на това как вибрират гласните гънки. Лезиите правят вибрациите неравномерни: повече „шум“ и по-малко „музика“.
- Защо новите набори от данни са важни. Преди това подобни разработки разчитаха на малки, „домашно приготвени“ проби – моделите бяха крехки. Bridge2AI-Voice е голям, многоцентров, етично събран набор от аудио записи, свързани с диагнози. Той е създаден като „обща тестова площадка“, за да се обучават и тестват алгоритми върху големи и хетерогенни данни.
- Къде са основните трудности?
- Гласът се променя поради микрофона, шума в стаята, студа, тютюнопушенето, езика, пола и възрастта.
- Традиционно има по-малко данни за жени, а женският глас е по-честотен - показателите се държат различно.
- Никой „домашен“ тест не може да замести прегледа или да постави диагноза - най-много помага да се реши: „необходимо ли е спешно да се обърнете към УНГ специалист?“
- Защо клиниката и пациентите се нуждаят от това? Ако хора с висок риск от лимфни възли/тумори могат да бъдат избрани за приоритетен преглед с кратък преглед, това ще ускори диагностиката, ще намали ненужните насочвания и ще осигури инструмент за самонаблюдение между посещенията (след операция, по време на терапия).
- Докъде би трябвало да доведе това: До валидирани приложения/модули за телемедицина, които:
- напишете реч според стандарта (фраза + протяжно „ааа“),
- изчисляване на основни характеристики (HNR, трептене, блясък, F0),
- издайте препоръка за контакт със специалист, ако профилът е тревожен,
- поддържане на динамика след лечението.
Идеята е проста: „дай телефона на ухото на УНГ лекар“ – не за диагноза, а за да не пропуснеш тези, които се нуждаят от бърза лична помощ.
Какво точно направиха?
- Взехме първото издание на многоцентровия, етично събран набор от данни Bridge2AI-Voice, водещ проект на NIH, където гласовите записи са свързани с клинична информация (диагнози, въпросници и др.).
- Бяха сформирани две аналитични проби:
- "рак на ларинкса / доброкачествени лимфни възли / здрави";
- „рак или доброкачествени възли“ спрямо спазматична дисфония и парализа на гласните гънки (други чести причини за дрезгавост).
- Основните гласови характеристики бяха идентифицирани от стандартизирани фрази: основен тон (F0), трептене, блясък и HNR (високочестотен шум), а групите бяха сравнени с помощта на непараметрична статистика. Резултат: най-стабилните разлики бяха в HNR и F0, като HNR и неговата вариабилност най-добре разделяха доброкачествените лезии както от нормата, така и от рака на ларинкса. Тези сигнали бяха по-отчетливи при мъжете.
Защо това е важно?
- Ранен скрининг без сонда. В момента пътят към диагнозата често означава назоендоскопия и, ако има съмнение, биопсия. Ако прости акустични характеристики, комбинирани с изкуствен интелект, могат да дадат приоритет на тези, които се нуждаят от ендоскопия, пациентите ще стигнат до УНГ специалист по-рано и ненужните насочвания ще бъдат намалени. Това е допълнение, а не заместител на лекаря.
- Големи данни за глас. Bridge2AI-Voice е рядък проект, при който гласът се събира с помощта на унифицирани протоколи и се свързва с диагнози; данните са достъпни за изследователите чрез PhysioNet / Health Data Nexus. Това ускорява разработването на надеждни гласови биомаркери вместо „чудодейни приложения“ върху малки извадки.
Какво е HNR?
Когато говорим, гласните гънки вибрират и създават обертонове (хармоници). Но вибрацията никога не е перфектна - винаги има шум в сигнала. HNR е просто колко повече „музика“ има в гласа, отколкото „съскане“. Когато гънките са увредени, вибрацията става по-неравномерна - има повече шум, HNR спада и неговите скокове (променливост) се увеличават. Това е закономерността, която авторите са уловили.
Важни откази от отговорност
- Това е пилотен, проучвателен анализ: без клинична валидация, с ограничения върху извадката от жени - така че ефектите им не са били значими. Необходими са по-големи и по-разнообразни данни и „изпичане“ на модели в различни клиники и на различни езици.
- Гласът е „многозначно“ нещо: той се влияе от настинка, пушене, рефлукс, микрофон, шум в стаята. Всеки „домашен тест“ трябва да може да вземе предвид контекста – и все пак да служи като филтър за насочване към УНГ специалист, а не като диагноза, поставена чрез кликване.
Какво следва?
- Разширете набора от данни (включително за жени и възрасти), стандартизирайте задачите и акустиката (четене на фраза, продължително „ааа“ и др.), опитайте мултимодални модели (глас + симптоми/рискови фактори от въпросника).
- Свържете акустичните признаци с резултатите от изследванията (ендоскопия, стробоскопия) и динамиката след лечение - така че HNR профилът също да може да се използва за мониторинг.
- Продължете с „отворената наука“: Bridge2AI-Voice вече публикува версии на набора от данни и инструментите – това е шанс бързо да достигнете до реални пилотни проекти в клиники.
Заключение
Възможно е да се „чуят“ проблеми с гласните струни от гласа – и евентуално да се насочи човекът към правилния специалист по-рано. Засега това е доста очевидна индикация (HNR и неговата вариабилност), но благодарение на големите отворени данни, гласовите биомаркери най-накрая имат шанс да се превърнат в надежден инструмент за скрининг.
Източник: Jenkins P. et al. Гласът като биомаркер: Експлораторен анализ за доброкачествени и злокачествени лезии на гласните гънки. Frontiers in Digital Health, 2025 (прието за публикуване). Данни — Bridge2AI-Voice (NIH/PhysioNet).