Tech(테크)/AI관련

chatGPT 학습데이터셋의 신뢰도 측면?

winapp 2023. 3. 19. 15:52

GPT3의 경우 전세계 인터넷 웹데이터 750GB를 학습했다고 나옴.

학습한 데이터의 신뢰성에 따라서 식별하여 골라서 학습시킨 것은 아님.
최종적으로 만들어진 모델의 신뢰성 체크를 진행함.

일반적인 머신러닝 절차처럼, 모델이 생성 되고 난 후 일정부분 튜닝 후 정확도를 개선해 나가는 과정을 거침

모델품질개선 작업에는 인간의 개입이 필수적임.
다만, 인간의 개입이 많이 들어갈수록 비용과 시간이 많아지므로,
적정선의 합의가 필요할듯 하네.