В Google Переводчик добавили 24 новых языка

Автор: Айзек Касвелл, старший разработчик программного обеспечения.

Перевод: https://www.tran-express.ru/

Обложка статьи про языки в гугл переводчике

На протяжении многих лет сервис Гугл Переводчик продолжает помогать преодолевать языковые барьеры и объединять людей по всему миру. И мы хотим, чтобы еще больше людей могли использовать наш сервис, в особенности носители тех языков, которые почти невозможно встретить в других приложениях. И поэтому мы добавили в Google Переводчик 24 новых языка. Таким образом, число языков, поддерживаемых сервисом, выросло до 133.

Около 300 миллионов человек говорят на этих новых языках – например, на языке мизо говорит примерно около 800 000 людей на северо-востоке Индии, а язык Лингала широко распространен в Центральной Африке, с его помощью общается более 45 миллионов людей. В рамках данного обновления в переводчик также впервые были добавлены языки коренных народов Америки, такие как кечуа, аймара и гуарани, а также сьерра-леонский креольскийязык, который считается английским диалектом.

Гугл-переводчик добавил 24 новых языка

Ниже представлен полный список новых языков, поддерживаемых Google Переводчиком:

  • Ассамский язык, на котором общается около 25 миллионов людей на северо-востоке Индии.
  • Аймара, на котором говорит около 2 миллионов жителей Боливии, Чили и Перу.
  • Бамана, на нем говорит 14 миллионов жителей Мали.
  • Бходжпури, встречается на севере Индии, в Непале и на Фиджи. На нем общается примерно 50 миллионов человек.
  • Дхивехи, или Мальдивский язык, распространен на Мальдивских островах, на нем говорит около 300 000 человек.
  • Догри, с его помощью общается около 3 миллионов людей в Северной Индии.
  • Эве, на нем говорят народы Ганы и Того, около 7 миллионов человек.
  • Гуарани, распространен в Парагвае, Боливии, Аргентине и Бразилии, на нем говорит примерно 7 миллионов человек.
  • Илоканский язык, широко распространен на севере Филиппин, на нем говорит в общей сложности 10 миллионов человек.
  • Конкани, на нем говорит около 2 миллионов людей в Центральной Индии.
  • Крио, или сьерра-леонский креольский язык, на котором говорит примерно 4 миллиона жителей Сьерра-Леоне
  • Курдский (Сорани) язык, на нем общается около 15 миллионов людей в Ираке и Иране.
  • Лингала, на нем говорит около 45 миллионов людей в следующих странах: Демократическая Республика Конго, Республика Конго, Центральноафриканская Республика, Ангола и Республика Южный Судан.
  • Луганда, по большей части распространен в Уганде и Руанде, на нем говорит примерно 20 миллионов человек.
  • Майтхили, распространен в Северной Индии и на нем говорит примерно 34 миллиона людей.
  • Мейтейлион (манипури),встречается на северо-востоке Индии, примерно 2 миллиона людей, которые на нем общаются.
  • Мизо, около 830 300 людей говорит на этом языке на северо-востоке Индии.
  • Оромо, распространен в Эфиопии и Кении, примерно 37 миллионов людей разговаривает на этом языке.
  • Кечуа, на этом языке общаются в Перу, Боливии, Эквадоре и в соседних странах. В общей сложности на этом языке говорит 10 миллионов людей.
  • Санскрит, на этом языке говорит около 20 000 человек в Индии.
  • Сепеди, или северный сото, распространен в Южной Африке, около 14 миллионов людей используют его.
  • Тигринья, на этом языке говорит около 8 миллионов в Эритрее и Эфиопии.
  • Тсонга, около 7 миллионов людей использует его в Эсватини, Мозамбике, Южной Африке и Зимбабве.
  • Чви, распространен в Гане. Около 11 миллионов людей говорит на этом языке.

Это обновление стало для Google Переводчика своеобразной технической вехой, ключевым моментом. Мы впервые использовали технологию Zero-Shot Machine Translation (машинный перевод без примеров), чтобы добавить новые языки. Zero-Shot Machine Translation работает по следующему принципу: модель машинного обучения видит только одноязычный текст, что означает, что она учится переводить на другой язык без каких-либо примеров. И хотя эта технология звучит впечатляюще, она далека от совершенства. Но мы продолжим работать над этими моделями, чтобы качество перевода ничуть не уступало переводам с более распространенных языков, таких как немецкий или испанский. Если вы хотите подробнее почитать о технических нюансах, ознакомьтесь с нашим постом об искусственном интеллекте Google в блоге и с исследовательской работой.

Мы благодарны всем носителям языков, профессорам и лингвистам, которые принимали участие в работе над этим обновлением и вдохновляли нас своей любовью к языкам и энтузиазмом. Если вы хотите, чтобы наш сервис поддерживал ваш язык в будущих обновлениях, делитесь вашими оценками или переводами через сервис Translate Contribute.

С оригиналом статьи "Google Translate learns 24 new languages" на английском можете ознакомиться в официальном блоге Google Переводчика.

Пользователи на сайте