ІНФОРМАЦІЙНА СИСТЕМА АВТОМАТИЗОВАНОГО СТВОРЕННЯ ТА АНАЛІЗУ КОРПУСУ ПОВІДОМЛЕНЬ СОЦІАЛЬНИХ МЕРЕЖ

Наталя Борисова, Каріна Мельник, Вікторія Мельник

Анотація


Метою етапі е розробка інформаційної системи автоматизованого створення та аналізу корпусу пові¬домлень соціальних мереж для отримання статистичної інформації щодо використання молоддю сленгових слів та виразів. Для досягнення поставленої мети комплексно використовувались методи корпусної лінгвістики та соціолінг¬вістики (анкетування, асоціативний експеримент). Основним результатом дослідження є розроблена інформаційна система, яка виконує дві основні задачі: створення корпусу та аналіз корпусу. Тексти для корпусу збираються інформа¬ційною системою з зазначених користувачем джерел за визначеними користувачем критеріями. Щодо аналізу інфор¬мації корпусу інформаційна система може аналізувати за обраними користувачем критеріями як весь корпус, так і його частину, або декілька частин. Результати аналізу корпусу можуть бути використані лінгвістами-аналітиками, спеціалістами в галузі автоматизованої обробки природної мови, корпусної лінгвістики, соціолінгвістики, а також іншими зацікавленими експертами та спеціалістами для моніторингу розвитку будь-яких соціолінгвістичних явищ. Наукова новизна одержаних результатів дослідження полягає у вдосконаленні технологій автоматизованого форму¬вання та аналізу лінгвістичних корпусів, що дозволяє підвищити швидкість обробки інформації. Практична значимість одержаних результатів полягає у формуванні алгоритмічного, лінгвістичного, інформаційного та програмного забез¬печення інформаційної системи автоматизованого створення та аналізу корпусів текстів.

Ключові слова


автоматизована обробка природної мови; корпусна лінгвістика; соціолінгвістика; інформаційна система; корпус текстів; статистичні характеристики використання слів; аналіз повідомлень соціальних мереж; молодіжний сленг

Повний текст:

PDF (English)

Посилання


Борисова Н. В., Ніфтілін В. В. Застосування методів корпусної лінгвістики для дослідження особливостей використання сучасного молодіжного сленгу. Інформаційні технології: наука, техніка, технологія, освіта, здоров'я: тези доповідей XXVI міжнародної науково- практичної конференціїMicroCAD-2018/ відп. ред. проф. Сокол Єї. Харків: НТУ «ХПІ». Ч1. С. 27

Борисова Н.В., Ніфтілін В.В. Автоматизоване створення електронного словника. Інформаційні технології: наука, техніка, технологія, освіта, здоров'я: тези доповідей XXV Міжнародної науково-практичної конференції MicroCAD-20171 відп. ред. проф. Сокол ЄІ. Харків: НТУ «ХПІ». Ч. І. С. 32

Мельник К. В. Метод інформаційного скринінгу медичної документації: монографія І відп. ред. В. С. Пономаренко. Харків: ТОВ «ДІСА ПЛЮС», 2018. С. 391-406.

Мельник К. В. Моделювання процесу інтелектуальної обробки медичних даних. Системи обробки інформації. 2017. № 4 (150). С. 237-244.

Crawford W., Csomay Е. Doing Corpus Linguistics. New York: Routledge, 2015.178 p.

Brezina V. Statistics in Corpus Linguistics: A Practical Guide. Cambridge: Cambridge University Press, 2018.314 p.

Friginal E. Studies in Corpus-Based Sociolinguistics. New York: Routledge, 2017.382 p.
DOI: https://doi.org/10.35546/піт.v0i25.498

Посилання

  • Поки немає зовнішніх посилань.