Cybernetics And Systems Analysis logo
Информация редакции Аннотации статей Авторы Содержание
КИБЕРНЕТИКА И СИСТЕМНЫЙ АНАЛИЗ
Международний научно-теоретический журнал
УДК 004.22+004.93'11
Д.А. Рачковский

ОСНОВАННЫЕ НА РАССТОЯНИЯХ ИНДЕКСНЫЕ СТРУКТУРЫ
ДЛЯ БЫСТРОГО ПОИСКА ПО СХОДСТВУ

Аннотация. Рассмотрен класс таких индексных структур для быстрого поиска по сходству, при конструировании и применении которых используется только информация о значениях или ранге некоторых расстояний/сходств между объектами. Обсужден поиск как по метрическим расстояниям (для последних выполняется неравенство треугольника и другие метрические аксиомы), так и по неметрическим. Представлены структуры, которые возвращают объекты базы, являющиеся точным ответом на поисковый запрос, а также структуры для приближенного поиска по сходству (они не гарантируют точность, но обычно возвращают близкие к точным результаты и работают быстрее структур для точного поиска). Изложены общие принципы конструирования и применения некоторых индексных структур, а также рассмотрены идеи, лежащие в основе конкретных алгоритмов, как известных, так и предложенных в последнее время..

Ключевые слова: поиск по сходству, поиск ближайшего соседа, индексные структуры, индексирование на основе расстояний, метрическое расстояние, неметрическое расстояние, метрическое дерево, граф соседства, метод ветвей и границ.



ПОЛНЫЙ ТЕКСТ

Рачковский Дмитрий Андреевич,
доктор техн. наук, ведущий научный сотрудник Международного научно-учебного центра информационных технологий и систем НАН Украины и МОН Украины, Киев,
e-mail: dar@infrm.kiev.ua.

© 2017 Kibernetika.org. All rights reserved.