OpenAI представила ИИ-инструмент Operator, способный самостоятельно выполнять задачи в интернете
Опубликовано 23.01.2025 в 23:51
Investing.com — Сегодня OpenAI представила новый инструмент искусственного интеллекта (ИИ) под названием Operator, разработанный для самостоятельного выполнения задач в интернете. Этот инструмент использует собственный браузер для взаимодействия с веб-страницами посредством набора текста, кликов и прокрутки. Будучи исследовательской версией, Operator имеет некоторые ограничения, но будет развиваться на основе отзывов пользователей.
Operator может управлять различными повторяющимися задачами в браузере, включая заполнение форм, заказ продуктов и создание мемов. Этот инструмент расширяет функциональность ИИ, используя те же интерфейсы и инструменты, с которыми люди взаимодействуют ежедневно, экономя время на рутинных задачах и предоставляя новые возможности для бизнеса.
Для безопасного и поэтапного запуска Operator изначально доступен Pro-пользователям в США на сайте operator.chatgpt.com. Этот ранний релиз поможет собрать отзывы пользователей и более широкой экосистемы, что позволит со временем вносить улучшения. В планах — в конечном итоге расширить доступ для пользователей Plus, Team и Enterprise, а также интегрировать эти возможности в ChatGPT в будущем.
Operator работает на основе новой модели под названием Computer-Using Agent (CUA), которая сочетает в себе возможности визуального восприятия GPT-4o с продвинутым рассуждением через обучение с подкреплением. CUA разработан для взаимодействия с графическими пользовательскими интерфейсами (GUI), такими как кнопки, меню и текстовые поля. Operator может видеть и взаимодействовать с браузером, что позволяет ему выполнять действия в интернете без необходимости в специальных API-интеграциях.
В случае возникновения проблем или ошибок Operator может использовать свои способности к рассуждению для самокоррекции. Если он сталкивается с задачей, которую не может выполнить, он передает управление пользователю, обеспечивая плавный и совместный опыт работы.
Несмотря на то, что CUA находится на ранней стадии развития, он уже достиг новых эталонных результатов в WebArena и WebVoyager, двух ключевых тестах использования браузера.
Чтобы использовать Operator, пользователям достаточно описать задачу, которую они хотели бы выполнить. Пользователи могут в любой момент взять на себя управление удаленным браузером, а Operator разработан так, чтобы просить пользователя взять управление на себя для задач, требующих входа в систему, ввода платежных данных или при решении CAPTCHA.
Пользователи могут персонализировать свои рабочие процессы в Operator, добавляя пользовательские инструкции для всех сайтов или для конкретных. Operator также позволяет пользователям сохранять запросы для быстрого доступа на главной странице, что идеально подходит для повторяющихся задач. Пользователи могут заставить Operator выполнять несколько задач одновременно, создавая новые диалоги.
Operator превращает ИИ из пассивного инструмента в активного участника цифровой экосистемы. Он стремится упростить задачи для пользователей и предложить преимущества компаниям, которые ищут инновационный клиентский опыт и более высокие показатели конверсии. Ведется сотрудничество с такими компаниями, как DoorDash (NASDAQ:), Instacart, OpenTable, Priceline, StubHub, Thumbtack, Uber и другими, чтобы убедиться, что Operator отвечает реальным потребностям, уважая при этом установленные нормы. Также предпринимаются усилия по улучшению доступности и эффективности определенных рабочих процессов, особенно в приложениях для государственного сектора, путем работы с такими организациями, как City of Stockton, для упрощения регистрации в городских службах и программах.
Эта статья была переведена с помощью искусственного интеллекта. Для получения дополнительной информации, пожалуйста, ознакомьтесь с нашими Условиями использования.