Українські вчені створили ШІ-модель для прогнозування туберкульозу
Науковці з Національного університету «Львівська політехніка» та Буковинського медуніверситету розробили систему штучного інтелекту для аналізу факторів поширення туберкульозу в Україні.
Дослідники з України створили інноваційну систему штучного інтелекту, яка дозволяє точно прогнозувати поширення туберкульозу та визначати ключові фактори, що впливають на захворюваність. Розробка стала результатом спільної роботи науковців з Національного університету «Львівська політехніка» та Буковинського державного медичного університету.
Україна переживає новий етап поширення туберкульозу, що робить актуальним пошук ефективних методів контролю та прогнозування захворюваності. Туберкульоз як соціальна хвороба тісно пов'язаний із соціально-економічними, медичними та демографічними факторами, що ускладнює боротьбу з його поширенням.
Вчені проаналізували масивний набір даних, який містив 400 записів за останні 16 років і охоплював усі регіони України. До аналізу включили інформацію про кількість спеціалізованих лікарень, флюорографічні обстеження на 100 тисяч населення, дані про вакцинацію, кількість бактеріовиділювачів, захворюваність серед міського та сільського населення, а також відсоток різних демографічних груп.
Дослідження також враховувало показники, що відображають рівень зловживання алкоголем та наркотиками, захворюваність лікарів у спеціалізованих лікарнях на 10 тисяч медичних працівників, показники ВІЛ-туберкульозу на 100 тисяч людей, випадки резистентного туберкульозу, невдачі лікування, перервані курси терапії та кількість хірургічних втручань.
Методологія дослідження включала кілька етапів. Спочатку науковці провели кореляційний аналіз для виявлення статистичних зв'язків між різними факторами та захворюваністю на туберкульоз. Використання коефіцієнта кореляції Пірсона дозволило оцінити силу та напрямок взаємодії між змінними.
Наступним кроком стало тестування різних моделей машинного навчання, включаючи лінійну регресію, дерева рішень, випадковий ліс, метод найближчих сусідів, машину опорних векторів, адаптивне підсилення, стохастичний градієнтний спуск та нейронні мережі зворотного поширення. Для перевірки стабільності моделей використовували п'ятикратну крос-валідацію.
На основі отриманих результатів дослідники створили ансамбль моделей, який поєднував прогнози найкращих алгоритмів для підвищення точності та надійності результатів. Використовувався метод стекінгу, що дозволив врахувати різні аспекти даних та зменшити варіативність прогнозу.
Кореляційний аналіз виявив найважливіші фактори впливу на захворюваність. Бактеріовиділення показало найвищий коефіцієнт детермінації 0,641, що вказує на сильний зв'язок між частотою бактеріовиділення в популяції та захворюваністю на туберкульоз. ВІЛ-туберкульоз також продемонстрував значний коефіцієнт 0,542, підкреслюючи зв'язок між цими двома захворюваннями.
Флюорографічні обстеження мали коефіцієнт 0,501, що підтверджує важливість регулярних медичних оглядів у виявленні та контролі туберкульозу, особливо в групах ризику. Захворюваність лікарів та хірургічне лікування також показали відносно високі значення, що може відображати вплив недотримання умов інфекційного контролю та важливість хірургії як додаткового методу лікування.
Тестування різних моделей машинного навчання показало, що метод стекінгу продемонстрував найкращі результати серед усіх розглянутих підходів. Коефіцієнт детермінації склав 0,83, що означає, що модель пояснює приблизно 83 відсотки варіації відповіді в наборі даних. Середньоквадратична помилка та корінь із середньоквадратичної помилки були найнижчими серед усіх моделей.
Аналіз важливості факторів, виконаний за допомогою стекованої моделі, дозволив ідентифікувати ключові змінні, що мають найбільший вплив на захворюваність туберкульозом. Показник бактеріовиділення значно відрізнявся від інших з важливістю 0,405, що повністю підтверджується літературними даними.
Флюорографічні обстеження населення посіли друге місце за важливістю з показником 0,059. Це підтверджує важливість регулярних медичних оглядів, особливо для груп ризику, у виявленні та профілактиці захворювання, що дозволяє рано виявляти нові випадки туберкульозу.
Дещо несподіваним виявився факт, що показник хірургічного лікування опинився серед факторів із значним впливом з важливістю 0,026. Згідно з сучасними глобальними протоколами лікування туберкульозу, хірургічне лікування показане лише в певних випадках і вже не використовується так часто, як раніше.
Аналіз SHAP надав методологію для інтерпретації складних моделей машинного навчання. Він дозволив ідентифікувати внесок кожного фактора в прогноз моделі, що є критично важливим для прозорості та ясності в медичних рішеннях та політичних рішеннях. Результати SHAP-аналізу повністю підтвердили важливість виявлених факторів.
Аналіз чутливості надав додаткову важливу інформацію. Логарифмічне зростання захворюваності показує швидке збільшення на тлі зростання бактеріовиділення, але потім визначається стабільний рівень насичення. З медичної точки зору це пояснюється тим, що активні бактеріовиділювачі швидко заражають своїх контактних осіб, а потім процес поширення інфекції призупиняється до того часу, поки нові активні хворі не почнуть заражати інших.
Лінійне зростання захворюваності на тлі показника флюорографічних обстежень демонструє поступове, стійке збільшення кількості активних хворих на туберкульоз. Важливість флюорографічних обстежень підтверджується останніми рекомендаціями Всесвітньої організації охорони здоров'я, особливо твердженням, що флюорографічні обстеження населення повинні зосереджуватися на якісному скринінгу груп ризику, а не на випадковому скринінгу всіх підряд.
Оскільки Україна все ще має досить високу захворюваність на туберкульоз, а кількість внутрішньо переміщених осіб досягла 4,9 мільйона під час воєнного періоду, всіх цих людей можна вважати групою ризику. Важливість регулярних флюорографічних профілактичних оглядів підтверджена численними дослідженнями.
Аналіз чутливості показника захворюваності на активний туберкульоз до показника хірургічного лікування туберкульозу легень демонструє логарифмічне зростання на початку та швидкий перехід до стабільного рівня. Це пов'язано з досягненням медикаментозного лікування туберкульозу протягом певного періоду.
Використання штучного інтелекту для аналізу соціально-економічних, медичних та демографічних даних допомогло ідентифікувати основні фактори, що сприяють захворюваності на туберкульоз в Україні. Зокрема, аналіз підтвердив значний вплив кількості спеціалізованих лікарень, флюорографічних обстежень населення та частоти бактеріовиділення на показник захворюваності.
Розробка та валідація моделей машинного навчання дозволила точно прогнозувати захворюваність на туберкульоз. Використання п'ятикратної крос-валідації підвищило надійність прогнозів, забезпечуючи стабільність та точність для різних демографічних груп.
Інтерпретація складних моделей через SHAP-аналіз та аналіз чутливості забезпечила глибоке розуміння впливу окремих факторів, дозволяючи формулювати цільові стратегії контролю та профілактики туберкульозу. Це створює основу для обґрунтованого прийняття рішень у сфері громадського здоров'я та оптимізації ресурсів охорони здоров'я.
Дослідження провели Денис Невінський, Дмитро Мартьянов та Ярослав Виклюк з Національного університету «Львівська політехніка», а також Ігор Сем'янів з Буковинського державного медичного університету. Результати їхньої роботи опубліковані в журналі «Системні дослідження та інформаційні технології».
Схожі новини
- Померла співавторка книги «Наші тіла, ми самі» Норма Свенсон15.06.2025, 22:50
- Чатботи легко обманути, а мозок миттєво оновлює карту винагород14.06.2025, 20:24
- Google тестує аудіоогляди у пошуку з штучним інтелектом14.06.2025, 17:05
- Штучний інтелект змінює вимоги роботодавців до працівників14.06.2025, 16:48
- FDA планує використовувати штучний інтелект для схвалення ліків10.06.2025, 19:13