Докладчики: Илона Роландовна Теблоева

Тема доклада: Методология автоматизированного формирования текстового корпуса

Аннотация: В докладе рассматривается методология автоматизированного формирования текстового корпуса из разнородных цифровых источников: социальных сетей, мессенджеров, научных публикаций и сайтов. Особое внимание уделяется приведению данных к единому формату, базовой тематической разметке по ключевым словам, а также дальнейшему развитию подхода через контекстный анализ и подготовку датасета для дообучения BERT.





Следующий анонс Предыдущий анонс