Автор: Айзек Касвелл, старший разработчик программного обеспечения.
Перевод: https://www.tran-express.ru/
На протяжении многих лет сервис Гугл Переводчик продолжает помогать преодолевать языковые барьеры и объединять людей по всему миру. И мы хотим, чтобы еще больше людей могли использовать наш сервис, в особенности носители тех языков, которые почти невозможно встретить в других приложениях. И поэтому мы добавили в Google Переводчик 24 новых языка. Таким образом, число языков, поддерживаемых сервисом, выросло до 133.
Около 300 миллионов человек говорят на этих новых языках – например, на языке мизо говорит примерно около 800 000 людей на северо-востоке Индии, а язык Лингала широко распространен в Центральной Африке, с его помощью общается более 45 миллионов людей. В рамках данного обновления в переводчик также впервые были добавлены языки коренных народов Америки, такие как кечуа, аймара и гуарани, а также сьерра-леонский креольскийязык, который считается английским диалектом.
Ниже представлен полный список новых языков, поддерживаемых Google Переводчиком:
- Ассамский язык, на котором общается около 25 миллионов людей на северо-востоке Индии.
- Аймара, на котором говорит около 2 миллионов жителей Боливии, Чили и Перу.
- Бамана, на нем говорит 14 миллионов жителей Мали.
- Бходжпури, встречается на севере Индии, в Непале и на Фиджи. На нем общается примерно 50 миллионов человек.
- Дхивехи, или Мальдивский язык, распространен на Мальдивских островах, на нем говорит около 300 000 человек.
- Догри, с его помощью общается около 3 миллионов людей в Северной Индии.
- Эве, на нем говорят народы Ганы и Того, около 7 миллионов человек.
- Гуарани, распространен в Парагвае, Боливии, Аргентине и Бразилии, на нем говорит примерно 7 миллионов человек.
- Илоканский язык, широко распространен на севере Филиппин, на нем говорит в общей сложности 10 миллионов человек.
- Конкани, на нем говорит около 2 миллионов людей в Центральной Индии.
- Крио, или сьерра-леонский креольский язык, на котором говорит примерно 4 миллиона жителей Сьерра-Леоне
- Курдский (Сорани) язык, на нем общается около 15 миллионов людей в Ираке и Иране.
- Лингала, на нем говорит около 45 миллионов людей в следующих странах: Демократическая Республика Конго, Республика Конго, Центральноафриканская Республика, Ангола и Республика Южный Судан.
- Луганда, по большей части распространен в Уганде и Руанде, на нем говорит примерно 20 миллионов человек.
- Майтхили, распространен в Северной Индии и на нем говорит примерно 34 миллиона людей.
- Мейтейлион (манипури),встречается на северо-востоке Индии, примерно 2 миллиона людей, которые на нем общаются.
- Мизо, около 830 300 людей говорит на этом языке на северо-востоке Индии.
- Оромо, распространен в Эфиопии и Кении, примерно 37 миллионов людей разговаривает на этом языке.
- Кечуа, на этом языке общаются в Перу, Боливии, Эквадоре и в соседних странах. В общей сложности на этом языке говорит 10 миллионов людей.
- Санскрит, на этом языке говорит около 20 000 человек в Индии.
- Сепеди, или северный сото, распространен в Южной Африке, около 14 миллионов людей используют его.
- Тигринья, на этом языке говорит около 8 миллионов в Эритрее и Эфиопии.
- Тсонга, около 7 миллионов людей использует его в Эсватини, Мозамбике, Южной Африке и Зимбабве.
- Чви, распространен в Гане. Около 11 миллионов людей говорит на этом языке.
Это обновление стало для Google Переводчика своеобразной технической вехой, ключевым моментом. Мы впервые использовали технологию Zero-Shot Machine Translation (машинный перевод без примеров), чтобы добавить новые языки. Zero-Shot Machine Translation работает по следующему принципу: модель машинного обучения видит только одноязычный текст, что означает, что она учится переводить на другой язык без каких-либо примеров. И хотя эта технология звучит впечатляюще, она далека от совершенства. Но мы продолжим работать над этими моделями, чтобы качество перевода ничуть не уступало переводам с более распространенных языков, таких как немецкий или испанский. Если вы хотите подробнее почитать о технических нюансах, ознакомьтесь с нашим постом об искусственном интеллекте Google в блоге и с исследовательской работой.
Мы благодарны всем носителям языков, профессорам и лингвистам, которые принимали участие в работе над этим обновлением и вдохновляли нас своей любовью к языкам и энтузиазмом. Если вы хотите, чтобы наш сервис поддерживал ваш язык в будущих обновлениях, делитесь вашими оценками или переводами через сервис Translate Contribute.
С оригиналом статьи "Google Translate learns 24 new languages" на английском можете ознакомиться в официальном блоге Google Переводчика.
- 140 просмотров