Молодой ученый ТПУ Борис Пякилля работает над созданием алгоритма машинного обучения, способного строить модели, предсказывающие молекулярные свойства малых органических соединений. Он основан на интеграции методов искусственного интеллекта и байесовского подхода из теории вероятностей. В дальнейшем алгоритм может применяться для разработки лекарственных средств и сельскохозяйственных пестицидов.
Ученым был предложен алгоритм машинного обучения, результатом работы которого является модель, предсказывающая липофильность — свойство вещества, характеризующее его химическое сродство к органическим веществам. Полученная модель способна учитывать возможную неопределенность предсказаний, вызванную нехваткой обучающих данных.
«Работа актуальна за счет появления большого количества проектов, связанных с оценкой молекулярных свойств, а также ростом данных о химических экспериментах. Информация о неопределенности предсказаний, мере их возможного разброса крайне важна для пользователей из химических и биологических лабораторий и научных институтов», — поясняет молодой ученый.
Разработанный алгоритм основывается на байесовском машинном обучении — разделе, который напрямую работает с неопределенностями и позволяет не только точечно оценивать параметры полученной модели, но и их распределение.
«Аналогичная работа ведется во многих институтах и фармкомпаниях. Уникальность нашего алгоритма — в вычислительных аспектах: скорости построения предсказательной модели, высоком качестве предсказания липофильности, возможности учитывать неопределенность предсказаний из-за нехватки обучающих данных или их низкого качества», — добавляет Борис Пякилля.
В дальнейшем алгоритм может быть использован в компаниях и лабораториях, связанных с разработкой лекарственных средств или сельскохозяйственных препаратов, в частности пестицидов.
Комментарии
(0) Добавить комментарий