Повна версія

Головна arrow Інформатика arrow Моделирование сложных сетей

  • Увеличить шрифт
  • Уменьшить шрифт


<<   ЗМІСТ   >>

Ранговые характеристики

Ранжирование - процесс, при котором поисковая система выстраивает результаты поиска в определенном порядке по принципу наибольшего соответствия конкретному запросу. Таким образом, представление результатов поиска зависит от алгоритма ранжирования, который используется в поисковой системе.

В результате поиска пользователь может получить большой список релевантных документов. Сортировку этого списка таким образом, чтобы наиболее важные для пользователя документы были в его начале, в технологиях информационного поиска принято называть ранжированием откликов информационно-поисковых систем.

Ранжирование результатов поиска по уровню релевантности возможно не для всех моделей поиска (например, невозможно для булевой модели).

Перспективный подход к ранжированию -использование многопрофильных шкал, сформированных на основе метаданных, сетевых свойств, данных о пользователях.

Например, реализация сюжетных цепочек в тематических информационных массивах и их взвешивание рассматриваются как один из алгоритмов ранжирования.

Ранжирование текстовых и гипертекстовых документов имеет существенные отличия. Ранжирование текстовых документов может осуществляться по уровню релевантности и другим параметрам, в том числе экстрагируемым из текстов.

Ранжирование гипертекстовых документов возможно также по свойствам, обуславливаемым сетевой структурой, гиперссылками.

В Интернет для определения авторитетности веб-страницы как источника информации или посредника используется анализ топологии сети, образованной документами и соответствующими гиперссылками. Два алгоритма ранжирования веб-страниц, основанных на связях, HITS (hyperlink induced topic search) и PageRank, были разработаны в 1996 году в IBM Дж. Клейнбергом [94] и в Стенфордском Университете С. Брином и Л. Пейджем [74].

Kleinberg J.M. Authoritative sources in a hyperlink environment. In Processing of ACM-SIAM Symposium on Discrete Algorithms, 1998, 46(5):604-632. Brin S., Page L. The Anatomy of a Large-Scale Hypertextual Web Search Engine. WWW7, 1998.

Оба алгоритма предназначены для решения "проблемы избыточности", свойственной широким запросам, увеличения точности результатов поиска на основе методов анализа сложных сетей.

 
<<   ЗМІСТ   >>