Как AI променя кардиологията: Поглед към моделите за класификация на множество патологии върху ЕКГ сигнали
Изкуственият интелект ( AI) има потенциала да направи революция в областта на кардиологията, като помогне на лекарите да диагностицират и лекуват сърдечните заболявания по-точно и ефективно. Една от най-обещаващите области на AI в кардиологията е предсказването на ключови патологии чрез модели за класификация с много обозначения (мултипатология) въз основа на сигнали от електрокардиограмата (ЕКГ).
ЕКГ сигналите са електрически сигнали, генерирани от сърцето, които могат да се записват неинвазивно с помощта на електроди, поставени върху кожата. ЕКГ сигналите са основен инструмент за диагностициране и наблюдение на сърдечни заболявания, като аритмии и сърдечни пристъпи. Интерпретирането на ЕКГ сигналите обаче може да бъде предизвикателство, тъй като те са сложни и съдържат голямо количество информация.
Нашите колеги Георги Налбантов, PhD., ръководител на Data Science and AI, и Светослав Иванов, Chief Data Scientist, работиха по статия за моделиране на многоетикетна класификация на ЕКГ сигнали по време на предизвикателството PhysioNet/Computing in Cardiology Challenge 2020, насочено към автоматизирани подходи с отворен код за класификация на сърдечни аномалии.
С огромния си опит в областта те имаха ключова роля в проектирането и внедряването на моделите с изкуствен интелект, които бяха използвани за анализ на ЕКГ сигнали. Повече за работата им по темата "Multi-Class Classification of Pathologies Found on Short ECG Signals" можете да прочетете в статията тук.
В тази статия ще разгледаме по-подробно как AI прави революция в кардиологията чрез използването на многокласовата класификация на ЕКГ сигнали и ще представим част от работата на нашите колеги.
Какво представлява класификацията с няколко етикета?
Многоетикетната класификация е техника за машинно обучение, която може да се използва за анализ на ЕКГ сигнали и автоматичното им класифициране в различни категории. Например алгоритъм за класификация с много етикети може да анализира ЕКГ сигнал и да го класифицира като показващ признаци на предсърдно мъждене, камерна тахикардия и левокамерна хипертрофия.
За да разработят алгоритъм за класификация с множество етикети, изследователите първо трябва да обучат модел за машинно обучение, като използват голям набор от данни за ЕКГ сигнали, които са били ръчно етикетирани от експерти. След това моделът използва тези етикетирани данни, за да се научи как да класифицира нови ЕКГ сигнали.
Едно от основните предимства на класификацията на ЕКГ сигнали с множество етикети е, че тя може да помогне на лекарите да диагностицират сърдечните заболявания по-точно и бързо. Традиционно лекарите трябва ръчно да анализират ЕКГ сигналите, което може да отнеме много време и да е податливо на човешки грешки. С алгоритъма за класификация с много етикети лекарите могат да получават автоматични диагнози, които се основават на обективни данни и не са подложени на човешки пристрастия.
Друго предимство на класификацията на ЕКГ сигнали с много етикети е, че тя може да помогне на лекарите да идентифицират сърдечни заболявания на по-ранен етап. Чрез по-обстоен анализ на ЕКГ сигналите лекарите могат да открият фини промени в електрическата активност на сърцето, които могат да показват ранни етапи на сърдечно заболяване. Това ранно откриване може да позволи на лекарите да се намесят по-рано, което потенциално може да подобри резултатите за пациентите.
Революция в диагностиката и лечението
На пазара вече се предлагат няколко инструмента за анализ на ЕКГ, базирани на изкуствен интелект, като например одобрената от FDA система за анализ на ЕКГ AI-Guardian. Тези системи използват алгоритми за класификация на множество етикети, за да анализират автоматично ЕКГ сигналите и да предоставят на лекарите диагнози в реално време.
Въпреки това все още има предизвикателства, които трябва да бъдат преодолени при разработването на инструменти за анализ на ЕКГ, базирани на AI. Едно от най-големите предизвикателства е да се гарантира, че алгоритмите са точни и надеждни. За да постигнат това, изследователите се нуждаят от достъп до висококачествени набори от данни, които съдържат широк спектър от ЕКГ сигнали от различни групи пациенти.
Георги Налбантов, Светослав Иванов и Джефри ван Прен разработиха метод за класифициране на сърдечни състояния въз основа на голям набор от данни от ЕКГ ленти. Те използват стратегия за определяне на вероятността за различни патологии въз основа на точките, които поставят на прогнозите. Тази стратегия гарантира, че очакваното разпределение на предсказаните етикети в тестовия набор е същото като наблюдаваното разпределение в обучаващия набор. Този подход обаче има ограничение, тъй като предсказаните етикети за даден пациент на теста трябва да са се появили в набора от данни за обучение.
"За да сме сигурни, че моделът е надежден в реални условия, записите на ЕКГ сигнала с шумни интервали се изключват преди предсказването на патологията, за да се избегне висока честота на фалшивите тревоги."
Предизвикателството "Изчисления в кардиологията" включваше 24 патологии, но много участници изразиха съмнения относно валидността на предоставените етикети за части от учебния набор. Това прави задачата за обучение изключително трудна, тъй като ако лекарят не успее да открие дадена патология или ако е предоставен шумен сигнал, моделът предсказва, че трябва да е налице патология, докато лекарят може да не я забележи поради шума. Това прави задачата за обучение изключително трудна.
Подходи за моделиране на алгоритми
Георги и екипът му прилагат многоетикетна многостъпкова стратегия за класифициране на патологии в ЕКГ ленти, като използват общо 23 патологии, както и "синусов ритъм".Те са установили, че включването на прогнозата за определена група патологии като входна характеристика в моделите за бинарна класификация "един срещу друг" е от полза. Те са приложили AdaBoost като класификатор за всички проблеми за двоична класификация, което признават за неоптимално, и не са извършили подбор на признаци за всеки проблем за класификация.
Използваният от тях подход на изходни кодове за коригиране на грешки (ECOC) за присвояване на множество предсказани етикети на тестови пациент има скрит недостатък, тъй като тези етикети трябва да са се появили в набора от данни за обучение. Авторите отбелязват, че техният метод може да бъде ограничен за реални приложения, тъй като преди предсказването на патологията трябва да се изключат зашумените интервали в записите на ЕКГ сигнала, за да се избегне висок процент на фалшиви тревоги.Те предполагат, че предоставянето на по-дълги ленти с доказана патология, при които лекарите могат да открият патологията на част от ЕКГ лентата и не могат да открият патологията на други части от лентата, е необходимо, за да се доближат до реално приложение на техните модели.И накрая, те умишлено избягват използването на техники за дълбоко обучение/невронни мрежи, за да гарантират, че резултатите им са възпроизводими.
В заключение
В MATLAB е създаден инструмент за анотиране за етикетиране на точки и интервали/шаблони на ЕКГ вълни, който се използва за етикетиране на патологични интервали, както и на шумни интервали и несъответствия между ЕКГ данните и предварително зададените етикети.Бяха изградени няколко бинарни класификатора от типа one-vs-rest, при които морфологичните характеристики, специфични за всяка патология бяха генерирани от сигналите. Бинарните класификатори бяха допълнени с многокласов класификатор, използващ методология за кодове за корекция на грешки (ECOC).Този подход постигна резултат за валидиране на предизвикателството от 0,616 и резултат за пълен тест от 0,194, което постави екипа на 23 място от 41 в официалното класиране.
Прочетете цялата статия Multi-Class Classification of Pathologies Found on Short ECG Signal (Многокласна класификация на патологии, открити върху кратък ЕКГ сигнал) от Георги Налбантов, Светослав Иванов и Джефри ван Прен на www.cinc.org/archives/2020/pdf/CinC2020-071.pdf.