Компания Grammarly инициировала сбор первого аннотированного GEC-корпуса украинского языка. Планирует выложить его в открытый доступ для общего пользования.
GEC - Grammatical Error Correction - это исправление грамматических ошибок. Языковой корпус - совокупность эссе, блогов и сообщений в соцсетях, отзывов, написанных обычными людьми. Языковеды проверят их и исправят. Эти данные можно будет использовать, чтобы научить компьютер исправлять грамматические ошибки.
"Сейчас команда состоит из инженера-исследователя, программного инженера, аналитического лингвиста и украинских языковедов. Хотим создать первый открытый аннотированный GEC-корпус украинского языка и выложить его в свободный доступ: пусть пользуются все, кому он может пригодиться. Такой шаг будет полезным для научного сообщества и всех, кто общается на украинском онлайн", - об этом корреспонденту Gazeta.ua рассказывает руководитель проекта по сбору корпуса Настасия Осидач.
В работе используют направление Natural-language processing - это обработка естественного языка. Оно позволяет машинам читать, понимать и обрабатывать человеческую речь. А предоставив инструменты для обработки украинского языка, можно научить компьютер понимать его.
ЧИТАЙТЕ ТАКЖЕ: Искусственный интеллект научили говорить на украинском
"Мы надеемся, что наличие такого корпуса в открытом доступе ускорит развитие новых систем для исправления грамматики украинского языка. Общаться на украинском грамотно на просторах интернета станет еще проще", - говорит Настасия Осидач.
Приобщиться к проекту может каждый. Для наполнения корпуса нужны живые украинские тексты, созданные по принципу "как думается, так и пишется". Ими можно поделиться на сайте проекта. Это не обязательно созданные специально тексты, принимаются уже существующие эссе или сообщения из социальных сетей.
Результатами потом сможет воспользоваться каждый желающий. Или для исследовательской работы, или для создания или улучшения собственного онлайн-приложения.
"Этот проект - один из маленьких шагов, которые приближают нас к замечательной цели - научить компьютер еще лучше понимать украинский язык, - добавляет менеджер по коммуникациям компании Grammarly Ирина Котькалова. - Эта цель вдохновляет всю нашу команду!"
IT-компания Grammarly разрабатывает онлайн-сервис на основе искусственного интеллекта для помощи в написании текстов на английском языке. Компанию создали в 2009 году в Украине. Сегодня офисы Grammarly расположены в Киеве, Сан-Франциско, Нью-Йорке и Ванкувере. Ее цель - улучшать жизнь, совершенствуя коммуникацию. Ежедневно ее онлайн-сервис помогает более 20 млн людей в мире писать на английском языке эффективнее, предоставляя рекомендации по правильности, четкости, увлекательности и тону сообщения. Grammarly создана, чтобы помогать пользователям, где бы они ни писали - благодаря вебредактору, приложениям для рабочего стола, браузерному расширению, мобильным клавиатурам и надстройке для Microsoft Office.
Комментарии