발췌
ChatGPT 사용설명서 -송준용

 

HR분야

채용관련 프로세스에 활용

1 서류전형 스크리닝에 GPT 활용하여, 선별작업 처리 / 혹은 사람의 일을 교차검증해주는 역할 부터...

2 서류에서 해당 지원자 장점/단점, 질문할만 항목 추출하여, 면접자에게 제공

인터뷰 예상질문 생성하여 면접자에게 제공

 

임직원의 경력 카테고리 등에 활용

(기본 경력데이터가 입력이 되어 있어야 하며 GPT 해당 정보에 접근가능하며, 프로그래밍 필요)

사내 개발자의 경력사항을 표로 정리해달라.

특정 프로젝트에 추천할 만한 인재를 선별해달라.

 

가장 많이 사용하는 프롬프트 명령어 / 한국어로 바꿔서 해도 될듯.

Write

Generate

Explain

Summarize

Analyze

Brainstorm

Idearize

Modify

 

질문을 잘해야 된다.

질문을 잘하는 기법에 대해서 먼저 공부를 하고

 

스캠퍼기법

창의적인 아이디어와 솔루션을 생성하기 위한 일종의 도구

S 대체 Substitue 제품 또는 아이디어의 특정 측면을 대체할 있는 항목에 대해 생각해보기 재료를 다른 재료로 대체하거나
  기능을 다른 기능으로 대체하면 어떻게 됩니까?
C 결합 Combine 아이디어나 제품을 어떻게 결합할 있을지 생각해보기 두가지 다른 기술을 결합하여 새로운 유형의 제품을 만든
다면
어떨까?
A 적응 Adapt 기존 아이디어, 제품에 새로운 요구를 충족시키거나,
새로운 문제를 해결하기 위해 어떻게 적용해볼 있을지 생각해보기
특정 SW프로그램을 다른 플랫폼이나 다른 산업에
적용할
있도록 조정이 가능할까?
M 수정 Modify 기존 아이디어, 제품을 수정하거나 개선해보기 자동차를 어떻게 개조하여 연료 효율을 높이거나 환경
친화적으로
만들 있을까요?
P 다른용도 Put to
another use
기존 아이디어, 제품을 다른 방식으로 사용할 있을지 생각해보기 산업에서 설계된 도구를 다른 산업에 적용가능할지
생각해보기
E 제거 Elimicate 제품, 아디이어 에서 제거할 있는 /기능은 없을지 생각해보기 제품에서 특정기능 없이 설계되었더라도 여전히 효과적일지?
R 재배열 Rearrange 기존 아이디어, 제품을 뒤집거나 재배열하여 새로운 것을 만들 있는지 프로세스의 단계 순서가 바뀌거나, 구성요소가 바뀌거나
재배열된다면
어떻게 될까요?

 

비즈니스프레임워크를 활용하여 질의하면 보다 퀄리티 있는 아웃풋을 기대할 있다.

SWOT분석
포터의 5 Forces
가치사슬분석
비즈니스 모델캔버스
맥킨지 7S 프레임워크

 

예시) 아래와 같이 순차적인 질의를 .

테슬라에 대해 SWOT분석을 해주세요.

SWOT분석결과를 six thinking hats 프레임워크를 하용 하여 결과 분석해주세요.

분석결과를 토대로 4P전략(Product, Price, Place, Promotion) 수립해주세요.

 




24 5 최신 기사

최근 메타 공식 블로그
 한국의 인공지능(AI) 스타트업 업스테이지와 매스프레소의 ‘매스(MATH) GPT’ 사례
콴다
, KT클라우드 쓴듯

매스프레소·업스테이지·KT가 개발한 '수학 GPT', 오픈AI 제쳐
출처: <https://www.etnews.com/20240108000247>

 

 

매스 GPT의 매개변수(파라미터)는 130억개 수준
 GPT-4(1조개)와 비교하면 작지만, 수학 능력에서는 세계 최고 수준이다.

1만2500개의 고난도 수학경시 문제로 구성된 ‘매스 벤치마크’에서 1점 만점에 0.488점을 받아
 오픈AI의 GPT-4(0.425점)를 제쳤다.

 

기존 거대언어모델

회사 LLM 매개변수
OpenAI GPT-3.5 1750억개

GPT-4 100조개?? 멀티모달
추정GPT-4: 알아야 모든 + GPT-3 ChatGPT와의 차이점 (ax-semantics.com)

GPT-4-Turbo

앤트로픽 클로드3
오푸스, 소넷, 하이쿠
구글 제미나이 울트라 1 7500억개

제미나이 프로

 

 

 거대언어모델(LLM) 대신 가성비가 좋은 sLLM 주목

회사 sLLM 매개변수
구글 제미나이 나노 18억개
 MS 파이(Phi)-3 미니 38억개 23 11, 멀티모달

파이(Phi)-1.5 13억개 멀티모달
메타 라마3 80억개

 

 거대언어모델의 경우 매개변수가 1000억개 이상

sLLM은 경량화를 통해 응답 속도를 향상시켰고 입력 데이터 최적화 등으로 LLM 못지않은 효율을 낼 수 있다는 점이 장점이다.

sLLM은 또 ‘온디바이스 AI’로 활용되기에 적합하다.

스마트폰, 노트북 등 기기 자체에 AI 서비스가 탑재

아울러 B2B(기업대기업) 시장에서는 ‘최소 비용, 최고 성능’을 내는 게 중요하기 때문에 sLLM이 보다 경쟁력이 있다.

한국

네이버 HCX-대시
업스테이지 솔라미니
파수 엘름
포티투마루 LLM42

 

네이버  하이퍼클로바X의 신규 경량화 모델인 ‘HCX-대시’  
기존 모델 대비 5분의 1 수준 가격

업스테이지
지난 3월 ‘솔라 미니’를 아마존 세이지메이커 점프스타트·AWS 마켓플레이스 등에 오픈소스로 공개했다. 고객사가 솔라 미니를 미세 조정해 자사의 맞춤형 생성 AI 서비스를 만들 수 있게 한 것이다. 에듀테크 산업용 sLLM도 출시했다.
 리걸테크 스타트업 로앤컴퍼니와 함께 ‘솔라-리걸’을 개발목표.

업계 관계자는 “법률·의료·금융 등 특정 분야에서 활용되는 AI 서비스를 구사할 때 범용 LLM을 활용하기보다는 해당 분야 데이터를 중점적으로 학습한 소형언어모델을 활용하는 게 효율적”이라고 말했다.

파수
 sLLM인 ‘엘름(Ellm)’을 출시했다. 엘름은 온프레미스 구축형 sLLM으로 코딩, 법률, 세무, 금융 등 다양한 직군, 산업 환경에서 활용할 수 있다는 게 파수의 설명이다. 특정 작업이나 도메인에 맞는 작은 데이터 세트를 활용해 모델을 추가적으로 훈련시킬 수도 있어, 기업에서는 특정 부서나 조직에서만 활용할 수도 있다.

미국 시장조사업체 밸류에이츠 리포트가 발간한 보고서에 따르면 sLLM 시장 규모는 2022년 51억8000만달러에서 오는 2029년 171억8000만달러로 성장할 전망이다.

 

출처: <https://biz.chosun.com/it-science/ict/2024/05/03/TILI5ZARGVDX5JICKRAHP7H6RA/>




'Tech(테크) > ChatGPT,OpenAI' 카테고리의 다른 글

GPT 활용사례  (0) 2024.05.20
GPT - 활용에 대해서  (0) 2023.07.02
GPT - 임베딩에 관하여  (0) 2023.07.02
GPT- fine tuning 미세조정 의 의미  (0) 2023.07.02
2023.06.13 chatGPT 업데이트 소식 (간략)  (0) 2023.07.02

GPT는 인간의 언어 자체를 잘아는 것은 아니다.
인간의 언어/지식을 벡터화하여 숫자 형태로 미리 학습을 한것.
인간의 뇌구조와 유사하게 (뉴런-신경전달물질 전달 등)
(인간의 언어는 유한하므로, 단어 혹은 단어보다 더 작은 단위(토큰)에 숫자를 붙여서,
그 숫자들을 이용하여, 연산하여 학습하거나 활용하는 것)

마찬가지로 이미지도 벡터화하여 숫자형태로 본다.
비전서비스, 분류서비스 에도
원본이미지의 특성추출, 조합, 추출, 조합과정을 거쳐서 최소의 벡터값을 추린 뒤 분류연산에 활용하는 구조?

즉, 할 수 있는 일들도 그러한 측면에서 한정적이다.

자연어처리 ?  대화의 문맥을 유사도측면에서 파악하여, 가장 적절한 언어문장 조합을 뱉어내어주는 원리

유사도 측정
즉, 질문의 가장 유사한? 적합한 데이터를 찾아 주는 것

요약
요약도, 벡터화하여 관련성 등등 고려하여, 요약하는 작업을 해주는것
당연히 컴퓨터이고 컴퓨팅 파워가 매우 높으니, 세세한 작업자체를 빠르고 대량으로 돌려버리는 것

기존에 알고 있을 법한 내용 작성
특정 목적의 특정 포맷 메일 작성하기 (텍스트 작성하기)
여러가지 상황 조건에 대한 메일 작성하기(텍스트 작성하기)

BM발굴 시에도 도움됨.
뭐뭐뭐 사업 관련  BM발굴 초안을 작성해죠

법적문서검토
기존 문제가 되는 유형을 잘알고 있을까?
문제가 되는 유형을 알려주고?
문제가 되는 유형과 비슷한 벡터값의 문장들을 찾아서 요약해죠 하면 될라나

공공기관, 규제문서(대량의)
관련 검토 요청
위와 같은 패턴으로? 




임베딩은 텍스트 데이터를 수치 벡터로 변환하는 과정 혹은 
단어나 문장의 의미와 특성을 반영한 벡터 표현자체를 말함.
숫자로 된 벡터구조

심층 신경망 기반의 모델
Word2Vec, GloVe, FastText, BERT 등 알고리즘을 이용하여 만듬
TensorFlow, PyTorch, Keras 등을 사용

그러나, 제공되는지는 데이터가 많다고함?

chatGPT에게 임베딩 벡터데이터를 넘겨줄 수는 없음.
GPT도 내부적으로 요청받은 데이터 및 처리하는 데이터는 임베딩처리하여 돌아가는것일뿐.


https://lsjsj92.tistory.com/657

 

OpenAI ChatGPT API를 활용해 추천 시스템 구현하기(feat. HuggingFace)

포스팅 개요 최근 OpenAI에서 ChatGPT의 공식 API가 드디어 공개되었습니다. ChatGPT는 계속해서 이슈가 대두되고 있는 굉장한 모델인데요. 이번 포스팅에서는 파이썬(Python) 환경에서 OpenAI의 ChatGPT API

lsjsj92.tistory.com

예시를 보면, 영화추천서비스 인데,

GPT가 하는 일은 질문에 대한 자연어처리와, 답변에 대한 자연어처리다.
핵심로직은, 개발을 해야됨.
기존 영화추천데이터를 다운받아 벡터화하고
사용자의 질문을 벡터화하여, 두개 간의 유사도를 측정하는 로직

 

아래와 같은 로직에 임베딩(벡터구조) 활용가능함.

  1. 문장 유사도 측정: 임베딩은 문장 간의 의미적 유사도를 측정하는 데 사용됩니다. 임베딩 공간에서 문장 간의 거리 또는 유사도를 계산하여 문장 유사도를 판단할 수 있습니다. 이를 활용하여 문서의 중복 검사, 검색 엔진의 쿼리-문서 매칭, 문장 단위 기계 번역 등에 사용될 수 있습니다.
  2. 단어 간 의미 유사도 계산: 임베딩은 단어 간의 의미적 유사도를 계산하는 데 사용됩니다. 단어의 임베딩 벡터 간의 거리 또는 유사도를 계산하여 단어 간의 관련성을 판단할 수 있습니다. 이를 활용하여 단어의 클러스터링, 유사한 단어 찾기, 단어 간 유추 작업 등에 사용될 수 있습니다.
  3. 감성 분석: 임베딩은 텍스트의 감성을 분석하는 데 사용될 수 있습니다. 감성 단어의 임베딩을 활용하여 텍스트의 긍정적 또는 부정적인 감성을 판단하고 감성 점수를 계산할 수 있습니다. 이를 활용하여 소셜 미디어 감성 분석, 제품 리뷰 분석, 사용자의 감성 분류 등에 사용될 수 있습니다.
  4. 문서 분류 및 클러스터링: 임베딩은 텍스트 문서를 분류하거나 클러스터링하는 데 사용됩니다. 문서의 임베딩 벡터를 계산한 후, 벡터 간의 거리 또는 유사도를 기반으로 문서들을 분류하거나 클러스터링할 수 있습니다. 이를 활용하여 뉴스 기사 분류, 토픽 모델링, 사용자 리뷰 분석 등에 사용될 수 있습니다.

 




GPT의 미세조정을 단순하게 접했을 때는,
특정 업무분야의 지식에 대해서도 학습시킬 수 있는 것으로 잘못 생각했음

실제는 달랐음.
기존에 학습된 모델에 대해서 조금 더 요구하는 의도에 적합하게 미세조정하는 것을 뜻함.

즉, 
GPT가 모르는 기업환경의 전문적인 데이터를 일부 미세조정 학습 시킨다고,
해당 분야의 전문적인 도메인 지식을 말해주는 것이 아님.


즉, 그래서,
Azure 의  AI검색서비스인 cognitive search 와 같은 다른 서비스를 조합하여,
전문적인 업무 도메인에 대한 지식을 빠르게 찾고, 그러한 결과데이터를 추가로 대화형모델에
전달하여 보다 자연스러운 자연어 답변이 가능하도록 해주는 서비스 아키텍쳐는 있음.

 




gpt-3.5-turbo 및 gpt-4 모델에서 입력에 함수 정보를 포함할 수 있게 됨.
함수는 어떻게 정의하는 것인지...
(모델이 스스로 해당 작업을 위해 코드를 생성하는 기능을 말함??)

함수 호출 기능을 지금 사용하고 싶은 경우
모델명의 뒤에 「0613」을 붙이면 됨
"gpt-4-0613"

 

「gpt-3.5-turbo」모델에서는 취급할 수 있는 토큰 수가 4096 토큰
새로운 「gpt-3.5-turbo-16k」모델은 1만 6384 토큰까지 취급

 

「text-embedding-ada-002」의 요금이 75% 다운
1000 토큰당 0.0001달러

「gpt-3.5-turbo」모델의 요금이 25% 다운
입력 1000 토큰당 0.0015달러,
출력 1000 토큰당 0.002달러

 

 




+ Recent posts