Google Translate 110 жаңа тілді «үйренді»: олардың арасында қырым татарлары мен шешен тілдері - ForumDaily
The article has been automatically translated into English by Google Translate from Russian and has not been edited.
Переклад цього матеріалу українською мовою з російської було автоматично здійснено сервісом Google Translate, без подальшого редагування тексту.
Bu məqalə Google Translate servisi vasitəsi ilə avtomatik olaraq rus dilindən azərbaycan dilinə tərcümə olunmuşdur. Bundan sonra mətn redaktə edilməmişdir.

Google Translate 110 жаңа тілді «үйренді»: олардың арасында қырым татары мен шешен тілдері

Google Translate адамдарға қарым-қатынас жасауға және қоршаған әлемді жақсырақ түсінуге көмектесу үшін тілдік кедергілерді еңсереді. Бұл құралды көбірек пайдаланушылар пайдалана алуы үшін компания үнемі соңғы технологияны пайдаланады, дейді Google блогы.

Сурет: Депозитфоталар

2022 жылы Google Translate Zero-Shot Machine Translation көмегімен 24 жаңа тілді қосты. Бұл машиналық аударма әдісі, онда модель оқу кезінде осы тілдер арасындағы аударманың бір мысалын көрмей-ақ мәтінді бір тілден екінші тілге аудара алады. Бұл тәсіл модельді үйрету үшін екі тілді мәтіннің үлкен көлемін қажет ететін дәстүрлі машиналық аударма әдістерінен ерекшеленеді.

Сонымен қатар, Google 1000 тіл бастамасын жариялады, бұл әлемдегі ең көп таралған 1000 тілді қолдайтын AI үлгілерін жасауға міндеттеме.

Google Translate енді қолдайтын тілдердің ауқымын кеңейту үшін жасанды интеллектті пайдаланады. Үлкен PaLM 2 үлгісімен компания Google Translate-те 110 жаңа тілді іске қосады. Бұл модель AI және табиғи тілді өңдеу саласындағы ең озық жетістіктердің бірі болып табылады. PaLM 2 машиналық аударма, генерация және мәтінді талдау сияқты әртүрлі тапсырмалар үшін пайдаланылады.

Тақырып бойынша: Google қақпағы астында: Интернеттегі бақылаудан қалай құтылуға болады

Жарты миллиардтан астам адамға аударма

Кантон тілінен Q'eqchi тіліне дейін бұл жаңа тілдерде 614 миллионнан астам адам сөйлейді, бұл әлем халқының шамамен 8%. Олардың кейбіреулері 100 миллионнан астам сөйлейтін негізгі әлемдік тілдерге жатады. Басқаларын шағын байырғы қауымдастықтар пайдаланады. Кейбір тілдерде сөйлейтіндер жоқтың қасы, бірақ ұлттар оларды жаңғыртуға бар күш-жігерін салуда.

Жаңа тілдердің төрттен бір бөлігі Африкадан келеді, соның ішінде Фон, Киконго, Луо, Га, Свази, Венда және Волоф.

Міне, Google Translate қолданбасында қолдау көрсетілетін кейбір жаңа тілдер:

  • Афажиан - Джибути, Эритрея және Эфиопияда сөйлейтін тональды тіл. Жаңа AI үлгісіндегі барлық тілдердің ішінде Афаджи еріктілер қауымдастығынан ең көп үлесті алды.
  • Кантон тілі бұрыннан Google Translate үшін ең көп сұранысқа ие тілдердің бірі болды. Бұл тіл мандарин тілімен жиі сәйкес келетіндіктен, бағдарламаны үйрету өте қиын болды.
  • Манкс - Мэн аралының кельт тілі. Соңғы ана тілінде сөйлейтін адам 1974 жылы қайтыс болды. Бірақ манкс тілін жаңғырту қозғалысының арқасында аралда мыңдаған манкс тілінде сөйлейтіндер пайда болды.
  • Nko - көптеген диалектілерді ортақ тілге біріктіретін Батыс Африка Мандинг тілдерінің стандартталған түрі. Оның бірегей әліпбиі 1949 жылы ойлап табылды және бүгінде бұл тіл белсенді түрде дамып, қолданылады.
  • Пенджаби (Шахмухи) - парсо-араб жазуын (Шахмухи) қолданатын пенджаби тілінің алуан түрі. Бұл Пәкістандағы ең көп сөйлейтін тіл.
  • Tamazight (Amazight) - бүкіл Солтүстік Африкада сөйлейтін бербер тілі. Көптеген диалектілерге қарамастан, жазбаша мәтін барлық ана тілінде сөйлейтіндерге түсінікті. Tamazicht латын және Тифинаг алфавитін қолданады. Олардың екеуіне де Google Translate қолдау көрсетеді.
  • Ток Писин — ағылшын тіліне және Папуа-Жаңа Гвинеяның лингва франкасына негізделген креол тілі. Егер сіз ағылшын тілінде сөйлесеңіз, сөз тіркесін Tok Pisin тіліне аударып көріңіз - мағынасын түсінуіңіз мүмкін!

Google Translate тілдерді қалай таңдайды

Translate қолданбасына жаңа тілдерді қосқанда көптеген факторларды ескеру қажет. Олардың вариацияларының үлкен саны бар: аймақтық сорттар, диалектілер, әртүрлі емле стандарттары. Шындығында, көптеген тілдерде бір стандартты опция жоқ, сондықтан «дұрыс» біреуін таңдау мүмкін емес. Компанияның көзқарасы әр тілдің ең жиі қолданылатын түрлеріне басымдық беру болды. Мысалы, Еуропадағы сығандар сөйлейтін ром тілі көптеген диалектілерден тұратын тіл. Әзірленген үлгілер Интернетте жиі қолданылатын оңтүстік Vlash Romani тіліне ең жақын мәтін жасайды. Бірақ оған солтүстік влах және балқан романы сияқты басқа диалектілердің элементтері де кіреді.

Сізді қызықтыруы мүмкін: Нью-Йорктегі басты жаңалықтар, біздің иммигранттар туралы әңгімелер және Үлкен Apple өмірі туралы пайдалы кеңестер - мұның барлығын ForumDaily New York сайтында оқыңыз

PaLM 2 тіл үлгісі бір-біріне жақын тілдерді үйрену үшін пайдаланылатын негізгі элемент болды. Мысалы, Авдхи мен Марвади хинди тіліне немесе креол тілдеріне, мысалы, Сейшел креоліне және Маврикий креоліне француз тіліне. Технология дамыған сайын және біз сарапшы лингвистермен және ана тілінде сөйлейтіндермен ынтымақтасуды жалғастырудамыз, компания тілдің бұдан да көп түрлері мен емле стандарттарын қолдауға ниетті.

Google Translate пайдаланатын жаңа тілдердің тізімін мына жерден табуға болады мұнда.

Форум күнін де оқыңыз:

Өміріңізді жақсы жаққа өзгертетін тоғыз тегін қолданба

Сіз білмейтін жеті Gmail мүмкіндігі

Amazon, Google және Meta-да сұхбаттар қалай жүргізіледі: Беларусь IT мамандарының жеке тәжірибесі

Гугл жасанды интеллект Ликбез аудармашы
Google News сайтындағы ForumDaily-ге жазылыңыз

Сіз АҚШ-тағы өмір және Америкаға иммиграция туралы маңызды және қызықты жаңалықтарды алғыңыз келе ме? — бізді қолда садақа бер! Сондай-ақ біздің парақшаға жазылыңыз Facebook. «Дисплейдегі басымдық» опциясын таңдап, алдымен бізді оқыңыз. Сондай-ақ, біздің сайтқа жазылуды ұмытпаңыз Telegram каналы  мен Instagram- Онда қызық көп. Және мыңдаған оқырмандарға қосылыңыз ФорумДүниежүзілік Нью-Йорк — онда сіз мегаполистің өмірі туралы көптеген қызықты және жағымды ақпаратты таба аласыз. 



 
1075 сұраныс 1,246 секундта.