Алгоритм пошуку зв'язків і залежностей у даних веб-сторінок

Лариса Олександрівна Катеринич, Юрій Юрійович Петелько

Анотація


На даний момент існує велика кількість пошукових систем, які здійснюють тією чи іншою мірою релевантнй пошук у колекціях документів. Під терміном «документ» мається на увазі будь-який носій текстової інформації: бази даних, веб сторінки, системи електронного документообороту, тощо. Здійснюючи запит у тій чи іншій системі, користувач зазвичай отримує відповідь у вигляді списку документів, які пошукова система вважає релеватними відповідно до отриманого запиту. Існує декілька способів оцінки релевантності документа відповідно до отриманого запиту. Оцінка релевантності напряму залежить від реалізації пошукової система, яка, ґрунтуючись на деякому власному алгоритмі, вираховує відповідність вихідного документа отриманому запиту.

Здійснивши пошук у будь-якій з таких систем, на вихід користувач отримує список документів (посилань на веб-сторінки), які система вважає релевантними. Після цього, щоб отримати важливу для користувача інформацію, потрібно відкрити (переглянути) один чи декілька з отриманих документів і проаналізувати їх.

Метою алгоритму пошуку зв’язків і залежностей (АПЗЗ) даних веб-сторінок є саме такий аналіз.


Ключові слова


алгоритм пошуку зв’язків і залежностей; пошукові системи; веб

Повний текст:

PDF

Посилання


Data Mining. A Knowledge Discovery Approach / [Krzystof J. Cios, WitoldPedrych, Roman W. Swiniarski, Lukasz A. Kurgan] – San Diego, USA. : “Springer”, 2007 - 606с.

Data Mining and Knowledge Discovery Technologies / David Taniar – New York, USA : “IGI publishing”, 2007 – 369c.

Data Mining Patterns: New Methods and Applications / [Pascal Poncelet, Maguelonne Tesseire, Florent Masseglia] – New York, USA: “IGI publishing”, 2008 – 307c.

Data Mining with Computational Intelligence / Lipo Wang, Xiuju Fu – Berlin, Germany: “Springer”, 2005 – 276c.

Data Mining Patterns: New Methods and Applications / [Pascal Poncelet, Maguelonne Tesseire, Florent Masseglia] – New York, USA: “IGI publishing”, 2008 – 307c.

Data Mining. Practical Machine Learning Tools and Techniques. Second Edition / Ian H. Witten, Eibe Frank – San-Francisco, USA: “Elsevier”, 2009 – 525c.

Learning Python, Fifth Edition / Mark Lutz – Sebastopol, USA : “O’Reilly Media Inc.”, 2013 – 1540c.

Making Sense of Data. A Practical Guide to Exploratory Data Analysis and Data Mining / Glenn J. Myatt – Canada: “John Wiley & Sons”, 2007 – 280c.

Pattern Recognition Algorithms for Data Mining. Scalability, Knowledge Discovery and Soft Granular Computing / Sankar K. Pal, Pabitra Mitra – Boca Raton, USA : “CRC Press”, 2004 – 200c.

Бібліографія : [Електронний ресурс] // Вікіпедія – вільна енциклопедія – Режим доступу : http://uk.wikipedia.org/wiki/Python


Посилання

  • Поки немає зовнішніх посилань.