Предметно-орієнтований пошук інформації в інтернет-ресурсах на основі методу зважених дескрипторів

Олександр Африканович Стенин, Віктор Петрович Пасько, В'ячеслав Анатолійович Лемешко

Анотація


Семантичний підхід є нині одним з основних шляхів вдосконалення інформаційно-пошукових систем, оскільки пряме лексичне порівняння запитів з індексами документів повністю не задовольняє розробника. Це пояснюється тим, що, як правило, знайдені документи володіють або полісемією (тобто багато зайвих слів) або синонімією (тобто не усі значущі слова витягаються). Тому у рамках семантичного підходу пропонується метод зважених дескрипторів, що дозволяє витягати найбільш значимі по сенсу і значенню документи, дуже близькі до предметної області.

Метод побудований на основі ідеї базисів Гребнера як які використовуються статистично побудовані концептуальні дескриптори. Цей метод припускає, що концептуальні дескриптори в пропозиціях мають низ сенс, що лежить, "латентний", який затінюється використанням різних слів. Ідеалом при визначенні базисів Гребнера рахуватимемо технічне завдання на інноваційний розвиток інформаційних технологій в конкретній предметній області. Для отримання значимих концептуальних дескрипторів скористаємося законами Джорджа Зипфа, відомого американського математика і лінгвіста.


Ключові слова


метод зважених дескрипторів; процес розробки; інформаційно-пошукові системи; Інтернет

Повний текст:

PDF (Русский)

Посилання


Sergeev V.A. Osnovy innovacionnogo proektirovanija – Ul'janovsk : UlGTU 2010. – 246s.

Tanenbaum Je., Ujezeroll D. Komp'juternye seti. 5-e izd. — SPb.: Piter, 2012. — 960 s.: il

Kuz'min A.V. Zolotareva N.N. Poisk v Internete - Sankt — Peterburg.: Izdatel'stvo NiT, 2011g. 276s.

Manning, K. Vvedenie v informacionnyj poisk / K. Manning. – M.: «Vil'jams», 2011.- 200 s.

Internet-zavisimoe povedenie ( Internet- addictive behavior) : (obzor) : (eview) / V.L.Malygin [i dr.] // Zhurnal nevrologii i psihiatrii imeni S. S. Korsakova. - 2011. - T. 111, № 8. - S. 86-92

Bogdanov-Kat'kov, N.V.; Orlov, A.A. Internet: Novejshij spravochnik; M.: Jeksmo, 2012. - 928 c.

Denis Shestakov (2011). «Sampling the National Deep Web». Proceedings of the 22nd International Conference on Database and Expert Systems Applications (DEXA), str.331-340.

Informatika i IKT. Cvetkova M.S., Velikovich L.S. 3-e izd., ster. - M.: 2012. — 352

Dakett, Dzhon Osnovy veb-programmirovanija s ispol'zovaniem HTML, XHTML i CSS / Dzhon Dakett. - M.: Jeksmo, 2015. - 768 c

Nekrest'janov I., Pavlova E. Obnaruzhenie strukturnogo podobija HTML-dokumentov. – SPb. Sankt-Peterburgskij gosudarstvennyj universitet, Trudy chetvertoj vserossijskoj konferencii RCDL, 2002. -ss.38-54.

Gerdt V.P. Groebner bases and invoiutive methods for algebraic and differential equations // Mathematics and Computers in Modelling, 25, No. 8/9, 1997,pp. 75-90.

K. E. Kechedzhy, O. V. Ustenko, V. A. Yampol’ski Rank distributions of words in additive many-step Markov chains and the Zipf Law. – Physical Review E. - 2005. – V.72. - pp. 1-6

Wentain Li. Random Texts Exibition Zipf’s Law – Like Word Frequency Distribution. Santa Fe institute. NM 87501. - 1992. - V. 38-№6. - pp. 1842-1845

Golub Dzh. Matrichnye ischislenija. - M.: Mir. - 1999. -548 c.




DOI: https://doi.org/10.35546/піт.v0i22.177

Посилання

  • Поки немає зовнішніх посилань.