Federated Learning за персонализирани модели за прогнозиране на здравни услуги при лечение на онкологични заболявания
Предизвикателство: Между 2009 и 2013 г. нашият ръководител на отдел " Data Science" ръководеше разработката и внедряването на проекта euroCat - новаторско решение за персонализирана методика на лечение в радиационната онкология. Проектът включваше пет болници в три държави от ЕС, които използваха данните на своите пациенти с онкологични заболявания с цел оптимизиране на персонализираното лечение. Целта беше да се разработи модел за Machine Learning (машинно обучение), който е способен да се обучава от различни източници на данни, без да се централизират данните на пациентите, по начин, който запазва неприкосновеността на личните данни на пациентите. Можете да прочетете повече за euroCat в академичния документ.
Решение: Това е техника, която позволява на множество страни да си сътрудничат по machine learning модел, без да споделят чувствителни данни и без да е необходимо данните да бъдат централизирани, като се обменят само параметри на модела по време на процеса на обучение.
При този подход всяка болница обучава част от модела на всяка итерация, като използва локалните си данни и след това споделя само някои параметри с централен сървър.След това централният сървър обобщава параметрите от всички държави, за да актуализира глобалния модел, без да има достъп до местните данни. Обучението продължава чрез цикли на итерации, докато не бъдат изпълнени критериите за конвергенция на модела. Ролята на "централен сървър" може да се изпълнява от всяка от болниците в мрежата. Екипът по изкуствен интелект на Георги Налбантов използва Federated Learning (Федеративно обучение), за да научи модели на Support Vector Machine (SVM), използвайки метода на множителите с променлива посока (ADMM), от различни бази данни, за да предскаже резултатите от лечението: които могат да бъдат или пряк ефект от лечението, или страничен ефект от лечението, например задух след лъчетерапия (на белия дроб).
Ефективността на SVM моделите е оценена чрез площта под кривата (AUC) при петкратна процедура за кръстосано валидиране (обучение в четири обекта и валидиране в петия).
Представянето на алгоритъма за обединено (федеративно) обучение е сравнено с централизираното обучение, при което наборите от данни на всички клиники са обединени в един набор от данни. Резултатът на централизирания модел беше (естествено) същият като този на модела за федеративно обучение, тъй като математически те дават един и същ резултат.
Проектът euroCat, в който се използва Federated Learning, оказа значително въздействие върху развитието на персонализираната медицина в радиационната онкология. Той показа, че е възможно да се сътрудничи по модел за машинно обучение, без да се споделят чувствителни данни, като същевременно се получават резултати, които са същите като тези, постигнати чрез централизирано обучение. Освен това подходът на проекта даде възможност за по-добро и персонално лечение на пациентите с рак, тъй като моделите за машинно обучение бяха обучени върху комбинация от набори от данни, които представяха вариациите в цялата популация от пациенти с рак от тези (пет) болници.
Решението се използва в няколко клиники в цяла Европа. Методологията обаче е приложима и в други сектори, в които споделянето на данни между независими страни не е възможно, като например здравеопазването, банковото дело и застраховането.
Открийте повече: Изтеглете подробна информация