Рак гортани является серьезной проблемой для системы здравоохранения. По данным оценок, в 2021 году в мире было выявлено около 1,1 миллиона случаев этого заболевания, при этом примерно 100 000 человек умерли. К основным факторам риска относятся курение, чрезмерное употребление алкоголя и заражение вирусом папилломы человека. Пятилетняя выживаемость при раке гортани варьируется от 35% до 78% в зависимости от стадии болезни и локализации опухоли.

Ранняя диагностика имеет ключевое значение для исхода лечения. Сейчас для выявления рака гортани применяются видеоназальная эндоскопия и биопсия – сложные и инвазивные процедуры. Однако исследование, опубликованное в журнале Frontiers in Digital Health, показало, что изменения в голосовых связках можно определить по особенностям звучания голоса. Подобные "поражения голосовых связок" могут быть как доброкачественными, так и свидетельствовать о начальных стадиях рака гортани. Эти данные открывают перспективы применения искусственного интеллекта для распознавания ранних форм заболевания по голосовым записям.

Проект Bridge2AI-Voice реализуется в рамках национальной программы "Мост к искусственному интеллекту" (Bridge2AI) Национального института здравоохранения США. Эта инициатива направлена на использование ИИ для решения сложных задач в области биомедицины. В рамках исследования команда проанализировала вариации тона, высоты, громкости и разборчивости речи, используя первую версию открытого набора данных Bridge2AI-Voice. В него вошли 12 523 голосовые записи от 306 участников из Северной Америки. Среди участников меньшая часть имела рак гортани, доброкачественные поражения голосовых связок либо два других заболевания голосового аппарата – спастическую дисфонию и односторонний паралич голосовых связок.

Ученые рассматривали различия в ряде акустических параметров, включая среднюю основную частоту (высоту тона), дрожание (колебания высоты), мерцание (изменения амплитуды) и соотношение гармоник к шуму – показатель, отражающий баланс между гармоническими и шумовыми компонентами речи. Результаты показали заметные отличия по соотношению гармоник и шума, а также по основной частоте у мужчин без патологий голоса, мужчин с доброкачественными поражениями связок и пациентов с раком гортани. У женщин подобных статистически значимых особенностей выявлено не было, но исследователи предполагают, что расширение базы данных может помочь обнаружить их в будущем.

Авторы заключили, что изменение соотношения гармоник к шуму может стать ценным инструментом для отслеживания развития заболеваний голосовых связок и раннего выявления рака гортани, по крайней мере, у мужчин.