Control Variates for Similarity Search

The main code (and paper) is found in the final folder.

Abstract

We present an alternative technique for similarity estimation under locality sensitive hashing schemes. By utilising control variates, we are able to achieve better theoretical variance reductions compared to methods that rely on maximum likelihood estimation. We show that our method obtains equivalent results, but slight modifications can provide better empirical results at lower dimensions. Finally, we compare the various methods' performances on the MNIST and Gisette dataset, and show that our model achieves better accuracy and stability.

Name		Name	Last commit message	Last commit date
Latest commit History 10 Commits
final		final
parallel		parallel
.gitignore		.gitignore
README.md		README.md
compute_est_cpu.py		compute_est_cpu.py
compute_est_gpu.py		compute_est_gpu.py
graph_data.py		graph_data.py
mp_globals.py		mp_globals.py
notes.md		notes.md
out_gisette.csv		out_gisette.csv
out_gisette_L.csv		out_gisette_L.csv
out_gisette_mini.csv		out_gisette_mini.csv
out_mnist.csv		out_mnist.csv
out_mnist_L.csv		out_mnist_L.csv
out_mnist_mini.csv		out_mnist_mini.csv
rng_state.out		rng_state.out
test1.ipynb		test1.ipynb
test1.py		test1.py
test2.ipynb		test2.ipynb
test2.py		test2.py
test3.ipynb		test3.ipynb
test3.py		test3.py
test4.py		test4.py
time_ests.py		time_ests.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Control Variates for Similarity Search

Abstract

About

Releases

Packages

Languages

mickey1356/weighted-vecs

Folders and files

Latest commit

History

Repository files navigation

Control Variates for Similarity Search

Abstract

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages