Искусственный интеллект впервые научили говорить на украинском языке. Искусственный интеллект создали на базе модели GPT-2, которая позволяет нейросети генерировать текст, близкий к языку людей.
Языковая модель выбирает слова, основываясь на предыдущих. Строит логическое дерево последовательностей. Этим занималось технологическое креативное агентство ISD Group, сообщает ain.ua.
"Разработка интеллекта заняла полгода от составления языкового корпуса к шлифовке конечного результата. Команда проекта состояла из 8 человек", - рассказал основатель и руководитель агентства Виктор Шкурба.
Разработчики использовали украинские словари Lang-uk, Brown-uk, ВЕСУМ и ГРАЧ для создания речевого корпуса. Собрали 3 гигабайта произведений на украинском из онлайн библиотек.
Затем генератор GPT-2 дополнили инструментами, которые помогают строить контекст и корректные последовательности слов в текстах.
"Этого было мало, ведь на выходе нейросеть "говорила" старомодно. Впоследствии к языковому корпусу добавили субтитры современных фильмов, сериалов, блоги, твиты и другой user-generated контент из социальных сетей. Таким образом интеллект начал говорить современно и сленгово", - добавил Шкурба.
Позже разработчики решили предоставить нейросети характер.
"На втором этапе разработчики решили пойти на эксперимент. Не повторять создание нейтральной системы, искусственного советчика, а пойти дальше и придать ей характер. Это плохой парень, даже немного сумасшедший, который постоянно подталкивает своих друзей на какие-то безумные поступки", - сообщил руководитель агентства
Для сбора данных привлекли молодежь через открытые игровые телеграмм-боты. Пользователи давали ответы на вопросы. После этого через нейросеть несколько раз пропускали вымышленные ею же идеи. Обозначали наиболее удачные.
ЧИТАЙТЕ ТАКЖЕ: Facebook перешел на украинскую транслитерацию Kyiv
"Для этого в ISD создали систему похвалы и наказаний для АИ. Каждый сгенерированный вариант набирал определенный score, состоящий из "оценок" следующих параметров: ширины контекста, учета темы предыдущего предложения, связности и удаленности от исходных вариантов датасета. При учете всех параметров, нейросеть получала "плюсы" - rewards, но за злоупотребление ими система давала "минус" - penalties", - рассказал Виктор Шкурба.
Нейросеть удалось заставить выполнять определенные действия по шаблонам языкового корпуса и скорректировать генерацию последовательностей в сторону самых непредсказуемых и неординарных ответов.
Испытать искусственный интеллект можно по ссылке.
На сайте президента Украины создали электронную петицию с требованием обеспечить возможность просмотра видео на стримингових сервисах на украинском языке.
Комментарии