Аннотация. Дан обзор индексных структур для быстрого поиска по сходству объектов, представленных бинарными векторами (с компонентами 0 или 1). Рассмотрены структуры как для точного, так и для приближенного поиска по расстоянию Хэмминга и другим мерам сходства. Представлены, главным образом, индексные структуры на основе хэш-таблиц, сохраняющего сходство хэширования, а также древовидных структур, графов соседства и нейросетевой распределенной автоассоциативной памяти. Изложены идеи известных и предложенных в последнее время алгоритмов.
Ключевые слова: поиск по сходству, расстояние Хэмминга, ближайший сосед, ближний сосед, индексные структуры, мультииндексное хэширование, локально-чувствительное хэширование, древовидные структуры, граф соседства, нейросетевая автоассоциативная память.
Рачковский Дмитрий Андреевич,
доктор техн. наук, ведущий научный сотрудник Международного научно-учебного центра информационных технологий и систем НАН Украины и МОН Украины, Киев,
e-mail: dar@infrm.kiev.ua.