ВКонтакте объявила о создании нейросети для генерации новостных заголовков

195 0
ВКонтакте объявила о создании нейросети для генерации новостных заголовков

Фото: Известия/ Александр Казаков

Перейти в Дзен Есть новость?
Присылайте »

Презентация состоялась в апреле на Европейской конференции по информационному поиску в Кельне.

Нейросеть за авторством разработчиков ВКонтакте способна создавать заголовки для новостей на двух языках. Генерировать заглавия на русском она училась на основе текстов информационного агенства «РИА Новости», на английском — при помощи статей The New York Times.

Для создания нейросети разработчики использовали архитектуру Universal Transformer в сочетании с технологией компрессии данных Byte Pair Encoding (BPE), нашедших широкое применение в практике машинного перевода. Сотрудники ВКонтакте стали пионерами в области применения BPE для модели суммаризации текста и в использовании русскоязычных текстов для ее обучения.

Для генерации заголовка нейросети требуется только «тело» новости. После обработки текста модель формулирует заглавие из фрагментов слов, добиваясь правильности падежей и связности предложения.

Вконтакте

Команде прикладных исследований ВКонтакте, созданной в 2018 году, удалось добиться немалых успехов. По словам опрошенных, машинный заголовок вышедший из-под «пера» нейросети, был не хуже оригинального в 45% случаев, а в 15% — оказался еще лучше. Даниил Гаврилов, разработчик команды ВКонтакте, подчеркивает, что сейчас ведутся активные работы по улучшению механизма генерации заглавий.

Ранее 5-tv.ru рассказывал, какие эмодзи оказались популярнее всего у россиян.