ИИ может помочь людям делать покупки, планировать и писать, но не готовить. Алгоритмам трудно следовать пошаговым рецептам в правильном порядке, но новое исследование, проведенное в Колледже вычислительной техники Технологического института Джорджии, может изменить ситуацию.
Исследователи создали набор данных под названием ChattyChef, в котором используются модели обработки естественного языка, способные помочь пользователю приготовить рецепт. Используя большую языковую модель GPT-J с открытым исходным кодом, набор данных ChattyChef с кулинарными диалогами следует рецептам вместе с пользователем.
Исследователи представили свой ИИ в работе "Improved Instruction Ordering in Recipe-Grounded Conversation", представленной на 61-й ежегодной встрече Association for Computational Linguistics.
Хотя другие исследователи теоретизировали о возможности создания ИИ-повара, работа Georgia Tech продвигает эту область вперед. "Мы - одна из первых исследовательских групп, которая проанализировала проблемы использования больших языковых моделей для создания ИИ-повара", - сказал Дуонг Ле, аспирант Школы интерактивных вычислений.
Большинство попыток использовать языковые модели для приготовления пищи терпят неудачу, потому что GPT-J не понимает, что пользователь хочет делать дальше, или намерения пользователя, и с трудом отслеживает, насколько далеко пользователь продвинулся в рецепте. Он также не может ответить на уточняющие вопросы, например, о количестве ингредиентов или времени приготовления.
Например, если кто-то пытается приготовить драники ИИ говорит ему налить масло на сковороду и добавить картофель. Затем пользователь спрашивает о следующем шаге. Алгоритм может перепутать порядок действий и сказать, что можно подавать блюдо, хотя оно еще не до конца приготовлено. Или пользователь задаст вопрос о том, как долго готовить дранник, и ИИ не будет достаточно точным, вместо этого он укажет общее время приготовления и не уточнит время приготовления для каждой стороны.
Учитывая это, исследователи позаботились о том, чтобы их модель имела две ключевые особенности:
- определение текущих намерений пользователя в рамках фиксированного набора возможностей, таких как "Попросить следующую инструкцию" или "Спросить подробности об ингредиентах";
- отслеживание рецептуры для определения того, на каком этапе находится пользователь, что работает с 80% точностью.
Объединенная информация из этих функций поддерживает третью инновацию ChattyChef - генерацию ответов. Намерение пользователя помогает сгенерировать лучший ответ на вопрос пользователя. ИИ выбирает наиболее важные части рецепта, а не включает весь рецепт, чтобы не запутать пользователя и не обременять его лишними действиями во время приготовления.
Набор данных ChattyChef создан на основе рецептов WikiHow с положительными оценками и менее чем восемью шагами. Чтобы определить, какие рецепты лучше всего включить в набор данных, исследователи привлекли людей для ролевой игры в то, как они могли бы использовать ChattyChef.
Исследователи считают, что инновации ChattyChef могут быть использованы во многих областях, помимо кулинарии, например, в руководствах по ремонту или документации к программному обеспечению.
Фото: Unsplash/Jonathan Borba
Комментарии
(0) Добавить комментарий