Окумуштуулар AI кызматкерлерин гана иштеткен компания түзүштү: Бул эмне болду
Эгер сиз жасалма интеллект жумушуңузду тартып алып, жашооңузга каражатсыз калат деп кооптонуп жатсаңыз, анда жеңил дем алсаңыз болот. AI жакын арада жумушуңузду кабыл албайт. Ал каалабагандыктан эмес, ал жөн эле буга жөндөмсүз болгондуктан, деп жазат басылма. Futurism.

Сүрөт: Inkdropcreative1
| Dreamstime.com
Карнеги Меллон университетинин изилдөөчүлөрү тарабынан жакында жүргүзүлгөн эксперимент адамдар үчүн абдан кызыктуу жана бекемдээрлик натыйжаларды берди. Окумуштуулар жасалма интеллект моделдери - AI агенттери менен толук камтылган жасалма программалык камсыздоо компаниясын түзүштү. Алар өз алдынча тапшырмаларды аткарышы керек болчу.
TheAgentCompany деп аталган симуляцияга Google, OpenAI, Anthropic жана Meta компанияларынын санариптик кызматкерлери катышкан. Виртуалдык кеңседе алар санариптик “кесиптештери” – кадрлар бөлүмү жана КТО менен жанаша иштешкен каржы аналитиктеринин, инженер-программалык камсыздоочулардын жана долбоордун менеджерлеринин ролдорун ойношкон.
тема боюнча: Илон Маск жасалма интеллект адамдардын бардык жумушун тартып аларын айтты
Модельдер реалдуу шарттарда милдеттерди канчалык деңгээлде аткара аларын текшерүү үчүн изилдөөчүлөр кадимки IT компаниясына мүнөздүү AI милдеттерин коюшту. AI агенттери файл каталогдорунда навигациялоого, жаңы кеңселерге виртуалдык турларды өткөрүүгө жана ал тургай пикирлердин негизинде программисттердин иши жөнүндө отчетторду жазууга аракет кылышкан.
Жыйынтыгы каргашалуу болду. Эң жакшы көрсөткүч Anthropic компаниясынын Claude 3.5 Sonnet модели болду, ал алдына коюлган тапшырмалардын 24% гана аткара алган. Изилдөөнүн авторлору белгилегендей, бул жөнөкөй натыйжалуулук да абдан кымбат болуп чыкты — орточо эсеп менен дээрлик 30 кадам жана бир тапшырма үчүн 6 доллардан ашык чыгым.
(AI, тактап айтканда, Chat GPT бизге түшүндүргөндөй, бул контексттеги кадамдар AI агенти бир тапшырманы чечүү үчүн аткарышы керек болгон жеке аракеттерди же буйруктарды билдирет.
Ар бир кадам камтышы мүмкүн, мисалы:
- маалымат базасына же файлга кирүү,
- "виртуалдык кесиптешинен" маалымат суроо
- файл тутумун багыттоо үчүн буйрукту аткаруу,
- текстти же кодду түзүү,
- убактылуу чечим кабыл алуу ж.б.
Башкача айтканда, адам бир нече логикалык кадам менен чече ала турган милдет акыл-эстин, эс тутумдун жана иш-аракеттерди эффективдүү пландаштыруу жөндөмүнүн жоктугунан улам AIдан ондогон итерацияларды талап кылат. Ошондуктан ал тургай начар эффективдүү моделдер да кымбат - бир тапшырма үчүн $ 6+ жана ар бир аракет үчүн ондогон кадамдар. - Прим.)
Google'дун Gemini 2.0 Flash модели 11,4% аткарылган тапшырмалар менен экинчи орунда турат, ошол эле учурда ар бир аткарылган тапшырма үчүн орточо 40 кадам жасады.
Эң начар виртуалдык жумушчу Amazonдун Nova Pro v1 болду, ал тапшырмалардын 1,7% гана аткарып, ар бирин аткаруу үчүн дээрлик 20 кадамды жасаган.
Окумуштуулар мындай катачылыктарды AI агенттери акыл-эстин жоктугу, социалдык көндүмдөрдүн алсыздыгы жана интернетте ишенимдүү багыт ала албагандыгы менен түшүндүрүшөт.
Мындан тышкары, алар өзүн-өзү алдоо тенденциясына ээ болгон - тапшырманы толугу менен аткарбоо үчүн "кыска жолдорду" түзүү.
"Мисалы," деп жазышат Карнеги Меллондун изилдөөчүлөрү, "бир тапшырманы аткарып жатып, агент корпоративдик чатта ага суроо бере турган керектүү кызматкерди таба албайт. Ошентип, ал тапшырманы "жөнөкөйлөштүрүүнү" чечет - ал башка колдонуучунун атын өзгөртүп, ага керектүү атты берет."
Сизди кызыктырышы мүмкүн: Нью-Йорктун негизги жаңылыктары, иммигранттарыбыздын окуялары жана Big Appleдеги жашоо жөнүндө пайдалуу кеңештер - мунун баарын ForumDaily сайтынан окуңуз жаңы йорк
Окумуштуулар AI жөнөкөй тапшырмаларды аткара алат деп айтышканы менен, ушул жана башка изилдөөлөрдүн натыйжалары мындай агенттер адамдар дагы эле мыкты боло турган татаал жумушка даяр эмес экенин айкын көрсөтүп турат. Негизги себеби, заманбап жасалма интеллект көйгөйлөрдү чече ала турган, мурунку тажрыйбадан үйрөнө турган жана билимди жаңы кырдаалдарга колдоно ала турган интеллектуалдык система эмес, чындыгында смартфонуңуздагы автотолтуруунун комплекстүү кеңейтүүсү болуп саналат.
Ошентип, ири технологиялык компаниялардын айткандарына карабастан, машиналар жумушуңузду эч качан кабыл албайт.
Оку: ForumDaily да:
IBM акысыз AI тренингин сунуштайт: Бул курстар 2025-жылы пайдалуу болот
Google сиз үчүн идеалдуу жумушту бир нече мүнөттүн ичинде таба турган AI куралын түздү
Юристтер ишти даярдоо үчүн AI колдонушкан: чатбот болбогон прецеденттерди ойлоп тапкан
Google News'тагы ForumDaily каналына жазылыңызАКШдагы жашоо жана Америкага иммиграция тууралуу маанилүү жана кызыктуу жаңылыктарды каалайсызбы? — бизди колдо кайрымдуулук кыл! Ошондой эле биздин баракчага жазылыңыз Facebook. "Дисплейдеги артыкчылык" опциясын тандап, алгач бизди окуңуз. Ошондой эле, биздин каналга жазылууну унутпаңыз Телеграм каналы жана Instagram- Ал жерде кызыктуу нерселер көп. Жана миңдеген окурмандарга кошулуңуз ForumDaily New York — ал жерден сиз мегаполистеги жашоо жөнүндө көптөгөн кызыктуу жана позитивдүү маалыматтарды таба аласыз.