Определение эффективности алгоритмов библиотеки машинного обучения PyCaret для видовой идентификации микроорганизмов на основании данных времяпролетной масс-спектрометрии

М.Д.Хамитова1, К.В.Детушев2, А.Г.Богун2

1Автономная некоммерческая организация дополнительного профессионального образования «Школа анализа данных», Москва, Российская Федерация;
2ФБУН «Государственный научный центр прикладной микробиологии и биотехнологии» Роспотребнадзора, Оболенск, Московская область, Российская Федерация

Резюме: Работа посвящена оценке возможности применения технологий машинного обучения для анализа данных, полученных при масс-спектрометрии бактериальных культур. В работе использовали масс-листы микроорганизмов видов Escherichia coli и Staphylococcus aureus, полученные с помощью MALDI-TOF масс-спектрометрии. Полученные данные обрабатывали с применением библиотеки PyCaret и выбранного в ходе исследования алгоритма Light Gradient Boosting Machine. Показано, что при анализе данных, полученных при идентификации штаммов бактерий E. coli и S. aureus из библиотеки PyCaret, алгоритм Light Gradient Boosting Machine позволяет получать результаты со степенью достоверности около 98%.

Ключевые слова: машинное обучение, масс-спектрометрия, MALDI-TOF, PyCaret

Для цитирования: Хамитова М.Д., Детушев К.В., Богун А.Г. Определение эффективности алгоритмов библиотеки машинного обучения PyCaret для видовой идентификации микроорганизмов на основании данных времяпролетной масс-спектрометрии. Бактериология. 2022; 7(2): 34-38.

DOI: 10.20953/2500-1027-2022-2-34-38

Читать полностью PDF-файл