Купите метку «2004» для своей закладки
и получите внимание 3 миллионов наших посетителей в месяц
Получение для каждой дорожки «отправной точки» (basic line), для чего использовали широко известные методы. Также мы осуществили несколько экспериментов, результаты которых сравниваем с результатами «классических» методов.
We introduce TextRank – a graph-based ranking model for text processing, and show how this model can be successfully used in natural language applications. We propose two innovative unsupervised methods for keyword and sentence extraction.
Алгоритм основан на построении описания рубрики в виде булевской формулы.
В настоящей работе мы излагаем способы ускорения процедур уточнения рубрикации, базирующиеся на интерактивном использовании локального статистического анализа, выявляющего основные понятия документов, возвращаемых поисковой машиной.
We compared human sentence rankings to three different approaches to sentence ranking: A simple paragraph-based approach intended as a baseline, two word-based approaches, and two coherence-based approaches.
This paper presents a new open text word sense disambiguation method that combines the use of logical inferences with PageRank-style algorithms applied on graphs extracted from natural language documents.
Описаны некоторые детали реализации полнотекстового поиска и ранжирования в Яндексе: особенности архитектуры выполнения запроса; параметризация поиска по кворуму; некоторые факторы и функции вычисления релевантности.
Рассматривается система автоматического выделения ссылок в нормативных, технических и экономических документах («согласно ст.15 Конституции РФ», «удовлетворяет ГОСТ 12.307-94»). использовался синтаксический анализатор на базе конечного автомата.
Описывается коллекция Legal2004 и поисковая система.
Простой метод адаптации BM25 для работы со структурированными документами