Применение интерпретируемой модели XGBoost, оптимизированной улучшенным алгоритмом черного коршуна, для терагерцового спектрального распознавания генетически модифицированного хлопкового масла

CHEN Tao ,  

ZHAO Li ,  

摘要

Для точной классификации и распознавания генетически модифицированного и немодифицированного хлопкового масла в данном исследовании предложена интерпретируемая модель классификации на основе улучшенного алгоритма черного коршуна для оптимизации модели градиентного бустинга XGBoost. Во-первых, с использованием системы терагерцевой временной спектроскопии (THz-TDS) были собраны терагерцовые спектры поглощения образцов генетически модифицированного и немодифицированного хлопкового масла в частотном диапазоне 0,3–1,8 ТГц. Затем традиционный алгоритм черного коршуна (BKA) был улучшен путём введения стратегии оптимизации функции приспособленности с двойной целью, стратегии обратного обучения для инициализации популяции и стратегии Леви-полётов с контролем с помощью функции распределения Рэлея, а оптимизированный алгоритм (DLBKA) применён для двухцельевой оптимизации гиперпараметров глубины дерева, скорости обучения и максимального количества итераций модели XGBoost, что позволило построить классификационную модель DLBKA-XGBoost. В заключение, модель была применена для распознавания генетически модифицированного хлопкового масла, а результаты интерпретируемого анализа модели были проведены с помощью метода SHAP. Результаты показали, что интерпретируемая классификационная модель XGBoost, оптимизированная улучшенным алгоритмом черного коршуна, не только повысила точность распознавания генетически модифицированного и немодифицированного хлопкового масла (точность на тестовой выборке достигла 97,78%, что на 4,45% выше по сравнению с моделью, оптимизированной традиционным алгоритмом черного коршуна, и на 14,45% выше по сравнению с моделью, оптимизированной традиционным алгоритмом китового оптимизатора (WOA)), но и обеспечила объяснения модели, уточнила положительное влияние ключевых частот признаков на результаты распознавания, повысив прозрачность и надежность модели. Таким образом, данное исследование предоставляет быстрый и точный метод анализа для распознавания генетически модифицированного хлопкового масла, а также ценную ссылку для распознавания других генетически модифицированных веществ.

关键词

Терагерцовое спектроскопия; Генетически модифицированное хлопковое масло; Градиентный бустинг; Улучшенный алгоритм черного коршуна; Интерпретируемый анализ

阅读全文