Доллар США $ — 00,0000 руб.
Евро € — 00,0000 руб.
04 июля 2020 | 14:00

Искусственный интеллект заговорит по-чукотски

Нейронные сети помогут лингвистам из НИИ ВШЭ изучить чукотский язык по произведениям авторов Северо-Востока

img006

Антонина Кымытваль, 1983 год/ Фото: архив "МП"


Московские лингвисты из НИИ Высшей школы экономики приступают к изучению чукотского языка в рамках проекта, нацеленного на исследование языков коренных малочисленных народов Севера, а поможет им глубже понять речь … искусственный интеллект.

Часть анализируемых текстов составят прозаические и поэтические произведения авторов Северо-Востока, среди которых Антонина Кымытваль, Иван Омрувье, Виктор Кеулькут, Владимир Тнескин, Михаил Вальгиргин и другие авторы.

Как сообщила участник исследовательской группы – лингвист Института языкознания РАН Карина Мищенкова, для обработки слов разработана модель нейронной сети, по сути искусственный интеллект, приспособленный для решения лингвистических задач. Эта сеть проведет анализ слов, разложив их на части-морфемы, установит синтаксические связи в предложениях. Подобные разработки в основе создания чат-ботов, систем машинного перевода и распознавания человеческой речи.

К «малоресурсным» чукотский язык отнесен в силу того, что лингвисты сочли его малоизученным: редко встретишь в свободном доступе разнообразные тексты, публикаций, которые можно обнаружить в Интернете. К подобным отнесены эскимосский, эвенский языки.

В случае успешного завершения проекта планируется создание автоматизированным способом массива параллельных текстов на чукотском и русском языках. Затем обработанные материалы выложат в виде синтаксических «деревьев» и морфологических моделей в международном некоммерческом банке языков Universal Dependencies.

Лингвистическим проектом руководит преподаватель Высшей школы экономики Университета Индианы (Блумингтон, США) Францис Таерз. В исследовательской группе состоят ученые Никита Сыхранов, Елизавета Ежергина.

Кстати


Это второй проект университета по поддержке языков малочисленных народов. Ранее был создан мультимедийный интернет-ресурс «Chuklang» chuklang.ru, на котором размещены исследования говора, фольклора тундровиков. На сайте выложены тексты с аудиозаписями, лингвистической разметкой, избранной библиографией по чукотско-камчатским языкам, краткие сведения о людях, носителях языков КМНС.

Поделиться новостью:

Читайте наши новости в WhatsApp И Telegramm


Читайте также