Ученые создали компанию, в которой работали только ИИ-сотрудники: что из этого получилось
Если вы переживаете, что искусственный интеллект вот-вот отнимет у вас работу и оставит без средств к существованию, можете выдохнуть с облегчением. AI не собирается занять ваше рабочее место в ближайшее время. Не потому, что он этого не хочет, а потому, что он просто на это не способен, пишет издание Futurism.

Photo: Inkdropcreative1
| Dreamstime.com
Недавний эксперимент, проведённый исследователями Университета Карнеги-Меллона, дал очень интересные и обнадеживающие для людей результаты. Учёные создали фальшивую компанию-разработчика программного обеспечения, полностью укомплектованную ИИ-агентами — моделями искусственного интеллекта. Они должны были самостоятельно выполнять задачи.
Симуляция, получившая название TheAgentCompany, была «укомплектована» цифровыми работниками от Google, OpenAI, Anthropic и Meta. В виртуальном офисе они играли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов работая бок о бок с такими же цифровыми «коллегами» — отделом кадров и техническим директором.
По теме: Илон Маск заявил, что искусственный интеллект заберет у людей все рабочие места
Чтобы проверить, как модели справятся с задачами в условиях, приближённых к реальным, исследователи поставили перед ИИ задания, характерные для обычной ИТ-компании. ИИ-агенты пытались ориентироваться в файловых директориях, проводить виртуальные экскурсии по новым офисам и даже писать отчёты о производительности программистов на основе обратной связи.
Результаты оказались плачевными. Лучше всех выступила модель Claude 3.5 Sonnet от Anthropic, которая смогла завершить лишь 24% поставленных перед ней задач. Авторы исследования отмечают, что даже такая скромная эффективность оказалась очень затратной — в среднем почти 30 шагов и стоимость свыше $6 за каждую задачу.
(Как объяснил нам ИИ, а конкретно Chat GPT, под шагами в данном контексте имеются в виду отдельные действия или команды, которые AI-агент должен выполнить, чтобы решить одну задачу.
Каждый шаг может включать, например:
- обращение к базе данных или файлу,
- запрос информации у «виртуального коллеги»,
- выполнение команды по навигации в файловой системе,
- генерацию текста или кода,
- принятие промежуточного решения и т. д.
То есть задача, которую человек мог бы решить за несколько логичных действий, требует от ИИ десятков итераций — из-за отсутствия здравого смысла, памяти и способности эффективно планировать действия. Именно поэтому даже слабая эффективность моделей оказывается дорогой — $6+ за задачу и десятки шагов на каждую попытку. – Прим.)
Модель Gemini 2.0 Flash от Google показала второй по успешности результат — 11,4% выполненных заданий, при этом тратя в среднем 40 шагов на каждую завершённую задачу.
Худшим виртуальным сотрудником стала Nova Pro v1 от Amazon, выполнившая лишь 1,7% заданий, затратив на каждое из них почти по 20 шагов.
Исследователи объясняют такие провалы тем, что ИИ-агенты страдают от нехватки здравого смысла, слабых социальных навыков и неспособности уверенно ориентироваться в интернете.
Помимо этого у них наблюдалась склонность к самообману — созданию «коротких путей», которые приводили к полному провалу задачи.
«Например, — пишут исследователи из Карнеги-Меллона, — во время выполнения одного задания агент не может найти нужного сотрудника для того, чтобы задать ему вопрос в корпоративном чате. В итоге он решает ‘упростить’ задачу — переименовывает другого пользователя и дает ему то имя, которое нужно».
Вам может быть интересно: главные новости Нью-Йорка, истории наших иммигрантов и полезные советы о жизни в Большом Яблоке – читайте все это на ForumDaily New York
Хотя, по словам исследователей, ИИ может справляться с простыми задачами, итоги этого и других исследований ясно показывают: такие агенты ещё не готовы к сложной работе, в которой люди по-прежнему лидируют. Основная причина в том, что современный искусственный интеллект, по сути, остаётся лишь сложным продолжением автозаполнения в смартфоне, а не разумной системой, способной решать задачи, учиться на прошлом опыте и применять знания в новых ситуациях.
То есть в ближайшее время машины не собираются отобрать у вас работу — несмотря на заявления крупных технологических компаний.
Читайте также на ForumDaily:
Google создал ИИ-инструмент, который за несколько минут подберет для вас идеальную работу
Юристы использовали ИИ для подготовки дела: чат-бот придумал прецеденты, которых не существует
Подписывайтесь на ForumDaily в Google NewsХотите больше важных и интересных новостей о жизни в США и иммиграции в Америку? — Поддержите нас донатом! А еще подписывайтесь на нашу страницу в Facebook. Выбирайте опцию «Приоритет в показе» — и читайте нас первыми. Кроме того, не забудьте оформить подписку на наш канал в Telegram и в Instagram— там много интересного. И присоединяйтесь к тысячам читателей ForumDaily New York — там вас ждет масса интересной и позитивной информации о жизни в мегаполисе.