NVIDIA сегодня представила GPU-ускоряемый фреймворк NVIDIA Jarvis, который позволяет компаниям использовать видео и голосовые данные для создания диалоговых ИИ-сервисов, адаптированных для их индустрии, продуктов и клиентов.
Сегодняшняя тенденция удаленной работы, обучения и развития телемедицины повысила спрос на специализированные диалоговые ИИ-сервисы, от клиентской поддержки до преобразования речи в текст в реальном времени и резюмирования видеозвонков, чтобы сделать процессы взаимодействия продуктивнее.
Первыми компаниями, взявших на вооружение продукты и решения на базе Jarvis, стали Voca с ИИ-помощником в колл-центре; Kensho, занимающаяся автоматическим транскрибированием аудиозаписей в области финансов и бизнеса; и Square с виртуальным ассистентом для назначения встреч.
«Диалоговый ИИ открывает путь в будущее для многих отраслей, так как приложения получают возможность понимать и взаимодействовать с пользователями реагировать с учетом нюансов и контекста, - говорит Дженсен Хуанг (Jensen Huang), учредитель и генеральный директор NVIDIA. - NVIDIA Jarvis поможет организациям быстро автоматизировать перегруженную клиентскую службу в здравоохранении, финансах, образовании и рознице».
Построенные с использованием Jarvis приложения получат преимущество при работе на новом графическом процессоре NVIDIA A100 с тензорными ядрами для ИИ-вычислений и инференса с новейшими оптимизациями в NVIDIA TensorRT™. Впервые стала возможна работа мультимодальных приложений, использующих мощные речевые модели и модели компьютерного зрения, в режиме реального времени с задержками менее 300 миллисекунд.
Jarvis имеет полноценный GPU-ускоряемый программный стек и инструменты, которые упрощают разработчикам задачу по созданию, развертыванию и запуску диалоговых приложений реального времени, способных понимать специфическую для разных компаний терминологию.
«IDC продолжает наблюдать быстрый рост рынка диалогового ИИ, так как компании всех масштабов начинают осознавать ценность хорошо обученных виртуальных ассистентов и чат-ботов для обслуживания клиентов и развития бизнеса, - говорит Дэвид Шубмель (David Schubmehl), директор по ИИ-платформам в IDC. - Ожидается, что мировые затраты на диалоговый ИИ, например, автоматизированные ассистенты службы поддержки, вырастут с 5.8 млрд долларов в 2019 году до 13.8 млрд долларов в 2023 году, т.е. на 24% за год».
Чтобы предложить своим клиентам интерактивное персонализированное взаимодействие, компаниям нужно тренировать свои диалоговые приложения на данных, характерных для их продуктов и требований их клиентов. Но создание сервиса с нуля требует знаний в области ИИ, большого объема данных и вычислительные ресурсы для обучения моделей, а также программное обеспечения для регулярной загрузки новых данных в модели.
Jarvis решает эту проблему, предлагая полноценный конвейер глубокого обучения для диалогового ИИ. В него входят современные модели глубокого обучения, такие, как NVIDIA Megatron BERT, для распознавания естественной речи. Компании могут адаптировать эти модели под себя с помощью NVIDIA NeMo, оптимизировать для инференса с помощью TensorRT и развернуть в облаке или на периферии с помощью таблиц Helm, доступных в каталоге NVIDIA GPU-оптимизированного ПО NGC.
Комментарии
(0) Добавить комментарий