일단 벡터 자체가 속도가 빠르다.
다양한 각도, 관점에서 비교하여 찾을 수 있다.
다양한 유사성 측정
단어와 문장간의 상대적 위치도 하나의 팩터가 됨.
사과와 배는 가까운 곳에 있다?
일부만 다른 벡터는 같다? 오타처리?
텍스트 임베딩 (Text Embedding) | 각 토큰을 숫자 벡터로 변환하는 작업 뿐 아니라, 추가로, 유사성, 분류, 의미 등을 벡터화에 같이 표현을 해준다. 단어 임베딩(Word Embeddings) 문장 임베딩(Sentence Embeddings) |
|
벡터검색 | Cog search의 기능 벡터이므로 ,여러가지 각도로 유사성을 찾아 주는 기술 기울기? 코사인유사도(두 벡터가 유사하면 각도가 작다) 벡터들 간의 거리? 유클리드거리? 자카드 유사도? |
유사성분석 검색 추천시스템 이미지검색, 영상검색, 음성검색, 추상적 정보검색 |
워드넷 : 단어간의 의미관계, 유사성정보 제공
동의의사전
검색서비스 내에, 문맥 및 의미를 분석하여 유사성확인하는 기능이 알고리즘에 들어가 있다.
Azure 내에 대표적인 벡터검색 서비스는 Azure cognitive search
'Tech(테크) > AI관련' 카테고리의 다른 글
무료 AI강의 Artificial Intelligence for Beginners (0) | 2023.07.02 |
---|---|
chatGPT에게 파이썬 프로그램 하나요청 해봄 (0) | 2023.05.12 |
chatGPT 좀 더 깊게 (0) | 2023.03.28 |
chatGPT 학습데이터셋의 신뢰도 측면? (0) | 2023.03.19 |
chatGPT 다국어 측면 질문 (1) | 2023.03.19 |