Компания Google планирует создание системы искусственного интеллекта, владеющей тысячей различных языков
Согласно имеющейся информации население всего земного шара говорит более чем на 7 тысячах различных языков и диалектов. Однако существующие сервисы автоматического перевода, в частности Google Translate, охватывают максимум 130 основных языков, и вскоре этого будет очень мало для удержания лидирующих позиций в этом сегменте информационного пространства.
На прошлой неделе представители компании Google объявили о начале работ над новой системой искусственного интеллекта, которая будет владеть тысячей различных языков. "После появления такой системы какой-нибудь из жителей Африки сможет спросить у своего телефона по поводу ближайшей аптеки на языке зулу, он будет понят и он получит ответ на этом же языке" - рассказывает Йохан Шалквик (Johan Schalkwyk), исследователь из компании Google, - "Сейчас подобные вещи, ставшие уже давно привычными для людей, говорящих на базовых языках, все еще недоступны достаточно значимой части человечества. И мы собираемся вскоре исправить эту ситуацию".
Собрать материал для обучения нейронных сетей тысяче языков будет совсем непросто. Поэтому данные будут извлекаться не только из текстов, но из видео, речевых записей и даже картинок. Реализация этого проекта займет несколько лет, и в первую очередь новая система будет использована в продуктах компании, включая YouTube и Google Translate.
Отметим, что данный проект является не единственным в своем роде. Ранее в этом году компания Meta (Facebook) объявила о собственном проекте под названием "No Language Left Behind", целью которого является создание системы перевода, охватывающей сотни из существующих языков.