Ревматоидный артрит (РА) — это хроническое аутоиммунное заболевание, характеризующееся постоянным системным воспалением и прогрессирующим поражением суставов, в первую очередь вызванным нарушением регуляции иммунных клеток.
Стандартные показатели клинического анализа крови, в частности количество лимфоцитов и тромбоцитов, точно прогнозируют тяжесть ревматоидного артрита, при этом модель «случайного леса» обеспечивает диагностическую точность около 87%.
Ревматоидный артрит (РА) — это хроническое аутоиммунное заболевание, характеризующееся постоянным системным воспалением и прогрессирующим поражением суставов, в первую очередь вызванным нарушением регуляции иммунных клеток. Несмотря на то, что иммунные механизмы в патогенезе РА хорошо изучены, связь между рутинными показателями клинического анализа крови и активностью заболевания остается недостаточно выясненной. Выявление доступных и надежных биомаркеров имеет решающее значение для улучшения стратификации риска и разработки персонализированных стратегий лечения.
Целью данного исследования было разработать интерпретируемую модель машинного обучения на основе стандартных гематологических параметров для оценки активности РА и изучения потенциальных связей и причинно-следственных отношений между показателями клеток крови и активностью заболевания.
Авторы провели ретроспективное исследование с использованием данных общего анализа крови и биохимических показателей 4401 пациента. В качестве основного показателя эффективности использовалась стратификация по степени тяжести заболевания. В общей сложности было исследовано 55 клинических переменных. Для выявления наиболее релевантных предикторов был применен метод рекурсивного исключения признаков. Было проведено сравнительное тестирование десяти алгоритмов машинного обучения, а также внутренняя валидация для оценки производительности моделей.
Интерпретируемость модели анализировалась с помощью метода аддитивных объяснений Шепли (SHAP). Для оценки взаимосвязи между тяжестью РА и показателями крови были использованы модели с ограниченными кубическими сплайнами и логистическая регрессия. Для дальнейшего исследования потенциальных причинно-следственных связей между выявленными показателями и риском развития РА был проведен анализ с использованием менделевской рандомизации.
Показатели состава крови оказались основными переменными, связанными с тяжестью РА. Среди оцененных алгоритмов модель «случайного леса» (Random Forest) продемонстрировала наилучшую прогностическую эффективность, достигнув значений площади под кривой (AUC) на тестовом наборе данных 0,870 и 0,874. Снижение количества лимфоцитов и увеличение вариабельности распределения тромбоцитов были значительно связаны с более высокой вероятностью развития тяжелого РА (диапазон отношения шансов 0,54–2,17). Нелинейный анализ показал, что как крайне низкие, так и высокие показатели клеток крови были связаны с худшими исходами. Кроме того, результаты менделевской рандомизации указывают на потенциальную причинно-следственную связь между показателями клеток крови и риском развития РА.
Показатели рутинных анализов крови тесно связаны с тяжестью течения РА и могут играть роль в прогрессировании заболевания. Модель машинного обучения на основе алгоритма «случайного леса» продемонстрировала высокую точность прогнозирования и предоставила интерпретируемые результаты, которые могут улучшить процесс принятия клинических решений. Полученные результаты подтверждают целесообразность интеграции инструментов прогнозирования на основе анализа клеток крови в персонализированные стратегии лечения РА, что потенциально может улучшить оценку риска и планирование терапии.
Therapeutic Advances in Musculoskeletal Disease
Associations of blood cell indices with the severity of rheumatoid arthritis: a retrospective case–control and machine learning modeling study
Rongqing He и соавт.
Комментарии (0)