일단 벡터 자체가 속도가 빠르다.

다양한 각도, 관점에서 비교하여 찾을 있다.

다양한 유사성 측정

단어와 문장간의 상대적 위치도 하나의 팩터가 .

사과와 배는 가까운 곳에 있다?

일부만 다른 벡터는 같다? 오타처리?

 

텍스트 임베딩 (Text Embedding) 각 토큰을 숫자 벡터로 변환하는 작업 아니라,
추가로, 유사성, 분류, 의미 등을 벡터화에 같이 표현을 해준다.



단어 임베딩(Word Embeddings)
문장 임베딩(Sentence Embeddings)

벡터검색 Cog search 기능
벡터이므로 ,여러가지 각도로 유사성을 찾아 주는 기술
기울기
?  코사인유사도( 벡터가 유사하면 각도가 작다)

벡터들 간의 거리?
유클리드거리? 자카드 유사도?
유사성분석 검색
추천시스템
이미지검색
, 영상검색, 음성검색,
추상적 정보검색

 

워드넷 : 단어간의 의미관계, 유사성정보 제공

동의의사전

 

검색서비스 내에, 문맥 의미를 분석하여 유사성확인하는 기능이  알고리즘에 들어가 있다.

Azure 내에 대표적인 벡터검색 서비스는 Azure cognitive search




+ Recent posts