Критерії подібності лінгвістичних моделей

Ігор Всеволодович Баклан, Андрій Ігорович Логвинчук, Тетяна Вікторівна Шулькевич

Анотація


Важливою складовою лінгвістичного підходу до виявлення аномалій у часових рядах є критерій, за яким оцінюється подібність двох моделей. Наявність аномалії встановлюється шляхом порівняння моделей. Саме від вибору критеріїв залежить можливість застосування лінгвістичного підходу до аналізу часових рядів різної природи. Для вчасної реакції на ситуацію важлива швидкість виявлення аномалії. Вибір критеріїв залежить від можливості застосування мовного підходу до аналізу часових рядів різного характеру. Розглянуті основні метрики схожості текстів Геммінга, Левенштейна, Джаро-Вінклєра та ін.

Ключові слова


часові ряди; метрики текстів; лінгвістичне моделювання; лінгвістична модель

Повний текст:

PDF

Посилання


Chandola V., Banerjee A., Kumar V. Anomaly Detection: A Survey. ACM Computing Surveys. 2009. Vol. 41. № 3. Article 15. 58 р.

Gupta M., Gao J., Aggarwal C. C. Han J. Outlier Detection for Temporal Data: A Survey. IEEE Transactions on Knowledge and Data Engineering. 2014. Vol. 25. № 1. 9 p.

Hodge V. J., Austin J. A. Survey of Outlier Detection Methodologies. Artificial Intelligence Review. 2004. Vol. 22. P. 85–126.

Лінгвістичне моделювання (математичне моделювання). URL: https://uk.wikipedia.org/wiki/Лінгвістичне_моделювання_(математичне_моделювання).

Логвинчук А. І., Баклан І. В. Застосування лінгвістичного моделювання до вирішення задачі пошуку аномалій. Інформаційні системи та технології управління (ІСТУ2019): Матеріали ІІІ всеукраїнської науково-практичної конференції молодих вчених та студентів. (Київ, 20-22 листопада 2019 р). Київ: НТУУ «КПІ ім. Ігоря Сікорського», 2019. С. 65–67.

Lohvynchuk A., Baklan I. Linguistic Approach for a Time Series Anomaly Detection. Slovac International Scientific Journal. 2019. Vol. 1. №35. Р. 16–18.

Баклан І. В. Лінгвістичне моделювання: основи, методи, деякі прикладні аспекти. Системні технології. 2011. № 3. С. 10–19.

Шулькевич Т. В., Баклан І. В. Гібридний лінгвістичний підхід до моделювання часових рядів. Прикладні питання математичного моделювання. 2018. № 2.

С. 191–202. DOI: https://doi.org/10.32782/2618-0340-2018-2-191-202

Баклан І. В., Шулькевич Т. В. Порівняльний аналіз прогнозу при варіації параметрів гібридної лінгвістичної моделі. Системні технології. 2019. Вип. 3. С. 32–41.

Cohen W., Ravikumar P., Fienberg S. E. A Comparison of String Distance Metrics for Name-Matching Tasks. KDD Workshop on Data Cleaning and Object Consolidation. 2003. Vol. 3. P. 73–78.

Відстань Геммінга. URL: https://uk.wikipedia.org/wiki/Відстань_Геммінга.

Відстань Левенштейна. URL: https://uk.wikipedia.org/wiki/Відстань_Левенштейна

Jaro M. Advantages in record linkage methodology as applied to the 1985 cenus of Tampa, Florida. Journal of the American Statistical Association. 1989. Vol. 84. Issue 406. P. 414–420.

Chandola, V., Banerjee, A., & Kumar, V. (2009). Anomaly Detection: A Survey. ACM Computing Surveys. 41, 3, Art. 15.

Gupta, M., Gao, J., Aggarwal, C. C. & Han, J. (2014). Outlier Detection for Temporal Data: A Survey. IEEE Transactions on Knowledge and Data Engineering. 25, 1.

Hodge, V. J., & Austin, J. A. (2004). Survey of Outlier Detection Methodologies. Artificial Intelligence Review. 22, 85–126.

Linhvistychne modeliuvannia (matematychne modeliuvannia). Retrieved from: https://uk.wikipedia.org/wiki/Лінгвістичне_моделювання_(математичне_моделювання).

Lohvynchuk, A. I., & Baklan, I. V. (2019). Zastosuvannia linhvistychnoho modeliuvannia do vyrishennia zadachi poshuku anomalii. Proceedings of the Informatsiini systemy ta tekhnolohii upravlinnia (ISTU2019): Materialy III vseukrainskoi naukovo-praktychnoi konferentsii molodykh vchenykh ta studentiv. (Kyiv, 20-22 November, 2019). Kyiv: NTUU «KPI im. Ihoria Sikorskoho», pp. 65–67.

Lohvynchuk, A., & Baklan, I. (2019). Linguistic Approach for a Time Series Anomaly Detection. Slovac International Scientific Journal. 1, 35, 16–18.

Baklan, I. V. (2011). Linhvistychne modeliuvannia: osnovy, metody, deiaki prykladni aspekty. Systemni tekhnolohii. 3, 10–19.

Shulkevych, T. V., & Baklan, I. V. (2018). Hibrydnyi linhvistychnyi pidkhid do modeliuvannia chasovykh riadiv. Prykladni pytannia matematychnoho modeliuvannia. 2, 191–202. DOI: https://doi.org/10.32782/2618-0340-2018-2-191-202

Baklan, I. V., & Shulkevych, T. V. (2019). Porivnialnyi analiz prohnozu pry variatsii parametriv hibrydnoi linhvistychnoi modeli. Systemni tekhnolohii. 3, 32–41.

Cohen, W., Ravikumar, P., & Fienberg, S. E. (2003). A Comparison of String Distance Metrics for Name-Matching Tasks. KDD Workshop on Data Cleaning and Object Consolidation. 3, 73–78.

Vidstan Hemminha. Retrieved from: https://uk.wikipedia.org/wiki/Відстань_Геммінга.

Vidstan Levenshteina. Retrieved from: https://uk.wikipedia.org/wiki/Відстань_Левенштейна

Jaro, M. (1989). Advantages in record linkage methodology as applied to the 1985 cenus of Tampa, Florida. Journal of the American Statistical Association. 84, 406, 414–420.




DOI: https://doi.org/10.32782/2618-0340/2019.2-2.2

Посилання

  • Поки немає зовнішніх посилань.