Алгоритмы ИИ могут научиться удивительно точному распознаванию информации, что позволяет им различать людей на фотографиях или медицинские изображения экране, как это делает врач. Но в большинстве случаев эти выдающиеся способности основаны на обучении, которое включает тысячи триллионов точек данных.
Это означает, что ИИ не способен также хорошо работать при ограниченном объеме данных, как это происходит при разработке лекарственных средств.
Виджей Панде, профессор химии из Стэнфордского университета, и его ученики считают, что достаточно новый вид глубокого обучения ИИ, названный «однократным обучением» (one-shot learning), который требует лишь небольшое количество точек данных, может стать решением проблемы ограниченного объема данных.
Вначале группа считала идею применения однократного обучения к проектированию неестественной из-за слишком ограниченных данных. Тем не менее, они имели успех в прошлом с методами машинного обучения, требующими только сотни результатов данных, и у них были данные, подходящие для тестирования однократного подхода. Казалось, стоит попробовать.
К их удивлению, результаты оказались положительными для разработки лекарственных средств и работы в некоторых областях химии.
Другие исследователи успешно применили метод однократного обучения для распознавания изображений и в геномике, но использование его для разработки лекарственных препаратов имеет свои особенности. В то время, как пиксели являются довольно естественными типами данных для алгоритмов, свойства малых молекул описываются труднее.
Чтобы сделать молекулярную информацию более удобоваримой, ученые впервые представили каждую молекулу в терминах связей между атомами (то, что математик назвал бы графом). Этот шаг выделил внутренние свойства химического вещества в доступную для обработки алгоритмом форму.
«Мы работали над некоторыми алгоритмами прототипа и обнаружили, что, учитывая несколько точек данных, можно сделать довольно точные предсказания», - сказал Бхарат Рамсандар, который является аспирантом в лаборатории Панде и со автором исследования.
Помимо использования в разработке лекарственных препаратов, этот инструмент будет широко применим в молекулярной химии. В лаборатории Панде уже испытываются эти методы на различных химических составах для солнечных батарей. Использованный исследователями в ходе экспериментов программный код выложен в открытый доступ, как часть библиотеки DeepChem.
Комментарии
(0) Добавить комментарий