Ученые создали компанию, в которой работали только ИИ-сотрудники: что из этого получилось - ForumDaily
The article has been automatically translated into English by Google Translate from Russian and has not been edited.
Переклад цього матеріалу українською мовою з російської було автоматично здійснено сервісом Google Translate, без подальшого редагування тексту.
Bu məqalə Google Translate servisi vasitəsi ilə avtomatik olaraq rus dilindən azərbaycan dilinə tərcümə olunmuşdur. Bundan sonra mətn redaktə edilməmişdir.

Ученые создали компанию, в которой работали только ИИ-сотрудники: что из этого получилось

Если вы переживаете, что искусственный интеллект вот-вот отнимет у вас работу и оставит без средств к существованию, можете выдохнуть с облегчением. AI не собирается занять ваше рабочее место в ближайшее время. Не потому, что он этого не хочет, а потому, что он просто на это не способен, пишет издание Futurism.

Photo: Inkdropcreative1
| Dreamstime.com

Недавний эксперимент, проведённый исследователями Университета Карнеги-Меллона, дал очень интересные и обнадеживающие для людей результаты. Учёные создали фальшивую компанию-разработчика программного обеспечения, полностью укомплектованную ИИ-агентами — моделями искусственного интеллекта. Они должны были самостоятельно выполнять задачи.

Симуляция, получившая название TheAgentCompany, была «укомплектована» цифровыми работниками от Google, OpenAI, Anthropic и Meta. В виртуальном офисе они играли роли финансовых аналитиков, инженеров-программистов и менеджеров проектов работая бок о бок с такими же цифровыми «коллегами» — отделом кадров и техническим директором.

По теме: Илон Маск заявил, что искусственный интеллект заберет у людей все рабочие места

Чтобы проверить, как модели справятся с задачами в условиях, приближённых к реальным, исследователи поставили перед ИИ задания, характерные для обычной ИТ-компании. ИИ-агенты пытались ориентироваться в файловых директориях, проводить виртуальные экскурсии по новым офисам и даже писать отчёты о производительности программистов на основе обратной связи.

Результаты оказались плачевными. Лучше всех выступила модель Claude 3.5 Sonnet от Anthropic, которая смогла завершить лишь 24% поставленных перед ней задач. Авторы исследования отмечают, что даже такая скромная эффективность оказалась очень затратной — в среднем почти 30 шагов и стоимость свыше $6 за каждую задачу.

(Как объяснил нам ИИ, а конкретно Chat GPT, под шагами в данном контексте имеются в виду отдельные действия или команды, которые AI-агент должен выполнить, чтобы решить одну задачу.

Каждый шаг может включать, например:

  • обращение к базе данных или файлу,
  • запрос информации у «виртуального коллеги»,
  • выполнение команды по навигации в файловой системе,
  • генерацию текста или кода,
  • принятие промежуточного решения и т. д.

То есть задача, которую человек мог бы решить за несколько логичных действий, требует от ИИ десятков итераций — из-за отсутствия здравого смысла, памяти и способности эффективно планировать действия. Именно поэтому даже слабая эффективность моделей оказывается дорогой — $6+ за задачу и десятки шагов на каждую попытку. – Прим.)

Модель Gemini 2.0 Flash от Google показала второй по успешности результат — 11,4% выполненных заданий, при этом тратя в среднем 40 шагов на каждую завершённую задачу.

Худшим виртуальным сотрудником стала Nova Pro v1 от Amazon, выполнившая лишь 1,7% заданий, затратив на каждое из них почти по 20 шагов.

Исследователи объясняют такие провалы тем, что ИИ-агенты страдают от нехватки здравого смысла, слабых социальных навыков и неспособности уверенно ориентироваться в интернете.

Помимо этого у них наблюдалась склонность к самообману — созданию «коротких путей», которые приводили к полному провалу задачи.

«Например, — пишут исследователи из Карнеги-Меллона, — во время выполнения одного задания агент не может найти нужного сотрудника для того, чтобы задать ему вопрос в корпоративном чате. В итоге он решает ‘упростить’ задачу — переименовывает другого пользователя и дает ему то имя, которое нужно».

Вам может быть интересно: главные новости Нью-Йорка, истории наших иммигрантов и полезные советы о жизни в Большом Яблоке – читайте все это на ForumDaily New York

Хотя, по словам исследователей, ИИ может справляться с простыми задачами, итоги этого и других исследований ясно показывают: такие агенты ещё не готовы к сложной работе, в которой люди по-прежнему лидируют. Основная причина в том, что современный искусственный интеллект, по сути, остаётся лишь сложным продолжением автозаполнения в смартфоне, а не разумной системой, способной решать задачи, учиться на прошлом опыте и применять знания в новых ситуациях.

То есть в ближайшее время машины не собираются отобрать у вас работу — несмотря на заявления крупных технологических компаний.

Читайте также на ForumDaily:

Компания IBM бесплатно обучает работе с искусственным интеллектом: эти курсы будут полезными в 2025 году

Google создал ИИ-инструмент, который за несколько минут подберет для вас идеальную работу

Юристы использовали ИИ для подготовки дела: чат-бот придумал прецеденты, которых не существует

работа эксперимент искусственный интеллект Ликбез
Подписывайтесь на ForumDaily в Google News

Хотите больше важных и интересных новостей о жизни в США и иммиграции в Америку? — Поддержите нас донатом! А еще подписывайтесь на нашу страницу в Facebook. Выбирайте опцию «Приоритет в показе» —  и читайте нас первыми. Кроме того, не забудьте оформить подписку на наш канал в Telegram  и в Instagram— там много интересного. И присоединяйтесь к тысячам читателей ForumDaily New York — там вас ждет масса интересной и позитивной информации о жизни в мегаполисе. 



 
1235 запросов за 1,361 секунд.