Google Translate 110 жаңы тилди "үйрөндү": алардын арасында крым-татар жана чечен тилдери
Google Translate адамдарга баарлашууга жана курчап турган дүйнөнү жакшыраак түшүнүүгө жардам берүү үчүн тил тоскоолдуктарын жеңет. Бул куралды көбүрөөк колдонуучулар колдоно алышы үчүн компания тынымсыз акыркы технологияны колдонуп келет, дейт Google блогу.
2022-жылы Google Translate Zero-Shot Machine Translation аркылуу 24 жаңы тилди кошту. Бул машиналык котормо ыкмасы, мында модель окуу учурунда бул тилдердин ортосундагы котормонун бир да мисалын көрбөй эле текстти бир тилден экинчи тилге которо алат. Бул ыкма моделди үйрөтүү үчүн эки тилдүү тексттин чоң көлөмүн талап кылган салттуу машина которуу ыкмаларынан айырмаланат.
Кошумчалай кетсек, Google дүйнөдөгү эң кеңири таралган 1000 тилди колдогон AI моделдерин түзүүгө милдеттенме алган 1000 тил демилгесин жарыялады.
Google Translate азыр колдогон тилдердин ар түрдүүлүгүн кеңейтүү үчүн жасалма интеллектти колдонот. Чоң PaLM 2 модели менен компания Google Translate'те 110 жаңы тилди ишке киргизет. Бул модель AI жана табигый тилди иштетүү тармагындагы эң алдыңкы жетишкендиктердин бири болуп саналат. PaLM 2 башкалардын арасында машина которуу, түзүү жана текстти талдоо сыяктуу ар кандай тапшырмалар үчүн колдонулат.
тема боюнча: Google капотунун астында: Интернеттеги көзөмөлдөн кантип кутулуу керек
Жарым миллиарддан ашык адамга котормо
Кантон тилинен Q'eqchiге чейин бул жаңы тилдерде 614 миллиондон ашык адам сүйлөйт, бул дүйнө калкынын болжол менен 8%. Алардын айрымдары 100 миллиондон ашык сүйлөгөн негизги дүйнөлүк тилдерге кирет. Башкаларын майда жергиликтүү жамааттар колдонушат. Ал эми кээ бир тилдерде сүйлөгөндөр дээрлик жок, бирок улуттар аларды жандандыруу үчүн бардык күч-аракетин жумшап жатышат.
Жаңы тилдердин төрттөн бирине жакыны Африкадан келет, анын ичинде Фон, Киконго, Луо, Га, Свази, Венда жана Волоф.
Бул жерде Google Translate'де колдоого алынган жаңы тилдердин айрымдары:
- Афажиан - Жибути, Эритрея жана Эфиопияда сүйлөгөн тоналдык тил. Жаңы AI моделиндеги бардык тилдердин ичинен Афаджи ыктыярчылар коомчулугунун эң көп салымын алган.
- Кантон тили көптөн бери Google Translate үчүн эң көп талап кылынган тилдердин бири болуп келген. Бул тил көбүнчө мандарин тили менен дал келгендиктен, программаны үйрөтүү бир топ кыйынга турду.
- Манкс - Мэн аралынын кельт тили. Акыркы тилчи 1974-жылы каза болгон. Бирок манкс тилин кайра жаратуу кыймылынын аркасында аралда миңдеген манкс тилинде сүйлөгөндөр пайда болгон.
- Nko Батыш Африка Мандинг тилдеринин стандартташтырылган түрү, көптөгөн диалектилерди жалпы тилге бириктирет. Анын уникалдуу алфавити 1949-жылы ойлоп табылган жана бүгүнкү күндө бул тил активдүү түрдө өнүгүп, колдонулууда.
- Пенджаби (Шахмукхи) - персо-араб жазуусун (Шахмукхи) колдонгон пенжаби тилинин бир түрү. Бул Пакистанда эң көп сүйлөгөн тил.
- Tamazight (Amazight) - Түндүк Африкада сүйлөгөн бербер тили. Көптөгөн диалектилерге карабастан, жазуу тексти бардык эне тилдерине түшүнүктүү. Tamazicht латын жана Tifinagh алфавитин да колдонот. Экөөнү тең Google Translate колдойт.
- Ток Писин - англис тилине жана Папуа-Жаңы Гвинеянын лингва франкасына негизделген креол тили. Эгер сиз англисче сүйлөсөңүз, фразаны Tok Pisin тилине которуп көрүңүз - маанисин түшүнө аласыз!
Google Translate тилдерди кантип тандайт
Котормочуга жаңы тилдерди кошууда көптөгөн факторлорду эске алуу керек. Алардын көптөгөн вариациялары бар: аймактык сорттор, диалектилер, ар кандай орфографиялык стандарттар. Чынында, көптөгөн тилдерде бир стандарттуу вариант жок, андыктан "туура" тилди тандоо мүмкүн эмес. Компаниянын мамилеси ар бир тилдин эң көп колдонулган түрлөрүнө артыкчылык берүү болгон. Мисалы, Европадагы цыгандар сүйлөшкөн ром тили көп диалектилерден турган тил. Иштелип чыккан моделдер интернетте көп колдонулган түштүк Vlash Romani тилине эң жакын текст түзүшөт. Бирок ал Түндүк влах жана балкан романы сыяктуу башка диалектилердин элементтерин да камтыйт.
Сизге кызыктуу болушу мүмкүн: Нью-Йорктогу жаңылыктар, биздин иммигранттардын окуялары жана Big Appleдеги жашоо жөнүндө пайдалуу кеңештер - анын бардыгын ForumDaily New Yorkтан окуңуз
PaLM 2 тил модели бири-бирине жакын тилдерди үйрөнүү үчүн колдонулган негизги элементи болгон. Мисалы, Awdhi жана Marwadi хинди же креол тилдерине, мисалы, Сейшел креолуна жана Маврикий креолуна французча. Технология өнүккөн сайын жана биз эксперт лингвисттер жана эне тилинде сүйлөгөндөр менен кызматташууну улантып жаткандыктан, компания тилдин дагы көп түрлөрүн жана орфографиялык стандарттарды колдоого ниеттенүүдө.
Сиз Google Translate колдонгон жаңы тилдердин тизмесин таба аласыз бул жерде.
Оку: ForumDaily да:
Жашооңузду жакшы жакка өзгөртө турган тогуз акысыз колдонмо
Сиз билбеген жети Gmail функциясы
Google News'тагы ForumDaily каналына жазылыңызАКШдагы жашоо жана Америкага иммиграция тууралуу маанилүү жана кызыктуу жаңылыктарды каалайсызбы? — бизди колдо кайрымдуулук кыл! Ошондой эле биздин баракчага жазылыңыз Facebook. "Дисплейдеги артыкчылык" опциясын тандап, алгач бизди окуңуз. Ошондой эле, биздин каналга жазылууну унутпаңыз Телеграм каналы жана Instagram- Ал жерде кызыктуу нерселер көп. Жана миңдеген окурмандарга кошулуңуз ForumDaily New York — ал жерден сиз мегаполистеги жашоо жөнүндө көптөгөн кызыктуу жана позитивдүү маалыматтарды таба аласыз.