# 벡터 유사도 검색이 무엇인가요? (What is Vector Similarity Search?)

> Clean Markdown view of GeekNews topic #10876. Use the original source for factual precision when an external source URL is present.

## Metadata

- GeekNews HTML: [https://news.hada.io/topic?id=10876](https://news.hada.io/topic?id=10876)
- GeekNews Markdown: [https://news.hada.io/topic/10876.md](https://news.hada.io/topic/10876.md)
- Type: news
- Author: [ninebow](https://news.hada.io/@ninebow)
- Published: 2023-09-14T20:56:43+09:00
- Updated: 2023-09-14T20:56:43+09:00
- Original source: [discuss.pytorch.kr](https://discuss.pytorch.kr/t/what-is-vector-similarity-search/2475?utm_source=geeknews)
- Points: 26
- Comments: 1

## Topic Body

머신러닝 어플리케이션의 주요한 기법 중 하나인 벡터 유사도 검색의 개념과 함께 어디에 사용하고, 사용 시의 예상되는 문제점들과 해결방법은 어떤 것인지를 알아보는 글을 번역하였습니다. 이 글은 이론/기술적으로 상세한 내용을 다루기보다는, 벡터 유사도 검색에 대한 개요와 함께 큰 그림(?)을 파악하는데 도움이 되는 글입니다.  
  
주요 목차 및 내용은 아래와 같습니다.  (⚠️주의⚠️: 이 글에는 [AI 인프라/도구 개발사 ENCORD사社](https://encord.com/about-us/?utm_source=pytorchkr)의 [블로그 글](https://encord.com/blog/vector-similarity-search/?utm_source=pytorchkr)을 허락 하에 번역하여 공유하는 것으로,  작성자인 ENCORD의 서비스를 홍보하는 문구가 다수 포함되어 있습니다.)  
  
* 벡터 유사도 검색이 해결하는 문제는 무엇인가요? / What Problem is Vector Similarity Search Solving?  
  * 차원의 저주 / Curse of Dimensionality  
  * 키워드 기반 검색의 비효율성 / Ineffective keyword-based search  
  * 확장성 / Scalability  
  * 비정형 또는 반정형 데이터 / Unstructured or Semi-Structured Data  
  
* 벡터 유사도는 어떻게 동작하나요? / How Does Vector Similarity Work?  
  * 벡터 임베딩 / Vector Embeddings  
  * 유사도 점수 계산 / Similarity Score Computation  
  * 최인접 이웃(NN) 알고리즘 / NN Algorithms  
  
* 벡터 유사도 검색의 사용 사례 / Use cases for Vector Similarity Search  
  * 추천 시스템 / Recommendation Systems  
  * 이미지 및 비디오 검색 / Image and Video Search  
  * 자연어 처리(NLP) / Natural Language Processing (NLP)  
  * 이상 징후 탐지 / Anomaly Detection  
  * 클러스터링 / Clustering  
  * 게놈 시퀀싱 / Genome Sequencing  
  * 소셜 네트워크 분석 / Social Network Analysis  
  * 콘텐츠 필터링 및 검색 / Content Filtering and Search  
  
* 벡터 유사도 검색의 걸림돌 / Vector Similarity Search Challenges  
  * 고차원 데이터 / High-dimensional Data  
  * 확장성 / Scalability  
  * 거리 측정 기준 고르기 / Choice of Distance Metric  
  * 인덱싱 및 저장소 요구사항 파악하기 / Indexing and Storage Requirements  
  * 정확도와 효율성 사이의 균형 맞추기 / The trade-off between Accuracy and Efficiency  
  * 데이터 분포 및 쏠림 / Data Distribution and Skewness  
  * 결과의 설명 가능성 / Interpretability of Results  
  
* 벡터 유사도 검색 문제의 해결방법 / How to Solve Vector Similarity Search Challenges  
  * 고차원 데이터 / High-Dimensional Data  
  * 거리 측정 기준 고르기 / Choice of Distance Metric  
  * 인덱싱 및 저장소 요구사항 / Indexing and Storage Requirements  
  * 신경망 해싱 / Neural Hashing  
  
* 컴퓨터 비전(CV) 분야에서의 벡터 유사도 검색 사용 사례 / How Vector Similarity Search can be used in Computer Vision  
  * 객체 탐지 / Object Detection  
  * 이미지 검색 / Image Retrieval  
  * 이미지 인식 / Image Recognition  
  * 이미지 세분화 / Image Segmentation  
  
* 벡터 유사도 검색 요약 / Vector Similarity Search Summary  
  
* 주요 요점 정리 / Key Takeaways

## Comments



### Comment 19185

- Author: ninebow
- Created: 2023-09-14T20:57:52+09:00
- Points: 1

임베딩(embedding)이 익숙하지 않으신 분들께서는 아래 글도 함께 참고하시면 좋습니다. :)  
- https://news.hada.io/topic?id=9316
