Cybernetics And Systems Analysis logo
Информация редакции Аннотации статей Авторы Архив
КИБЕРНЕТИКА И СИСТЕМНЫЙ АНАЛИЗ
Международний научно-теоретический журнал
УДК 004.22+004.93'11
Д.А. Рачковский

БИНАРНЫЕ ВЕКТОРЫ ДЛЯ БЫСТРОЙ
ОЦЕНКИ РАССТОЯНИЙ И СХОДСТВ

Аннотация. Рассмотрены методы и алгоритмы быстрой оценки мер расстояния/сходства исходных данных по векторным представлениям с бинарными или целочисленными компонентами, полученным из исходных данных, которые являются в основном векторами большой размерности с различными мерами расстояния (угловое, евклидово и др.) и сходства (косинус угла, скалярное произведение и др.). Обсуждены методы без обучения, использующие главным образом случайное проецирование с последующим квантованием, а также сэмплирование. Полученные векторы можно применять в алгоритмах поиска по сходству, машинного обучения и др.

Ключевые слова: расстояние, сходство, вложения, скетчи, случайное проецирование, сэмплирование, бинаризация, квантование, лемма Джонсона–Лин- денштраусса, ядерное сходство, поиск по сходству, локально-чувствительное хэширование.



ПОЛНЫЙ ТЕКСТ

Рачковский Дмитрий Андреевич,
доктор техн. наук, ведущий научный сотрудник Международного научно-учебного центра информационных технологий и систем НАН и МОН Украины, Киев,
e-mail: dar@infrm.kiev.ua.

© 2017 Kibernetika.org. All rights reserved.