기계학습 Machine Learning
수학과 통계를 사용하여 알 수 없는 값을 예측하는 모델을 만드는 기술
자전거 일일 임대수요 예측하는 모델
회귀모델이 가장 적합함.
적절한 분석기법, 모델을 찾기 위한, 머신러닝 플랫폼 on 클라우드
-
Azure 포털에서 기계학습 생성
-
개요에서 위의 링크를 누르면 아래 URL로 이동됨
-
컴퓨팅 인스턴스 생성 (가상머신) : 데이터과학자가 데이터 및 모델작업에 사용하는 워크스테이션 개념
-
컴퓨팅 클러스터 생성(가상머신) : 주문형 실험코드 처리를 위한 확장가능 가상머신 클러스터
테스트 시 최소 카운트 0으로 해야, 과금이 많이 발생하지 않음.
-
데이터세트 만들기
예제 데이터 가져오기(web URL) https://aka.ms/bike-rentals
-
자동화된 ML실행 만들기
ML실행 Target 열은 rentals 지정
regression
회귀 모델 선택
여러 알고리즘 중에 사용하지 않는 알고리짐 체크해줌.
시간이 걸림.
좀 돌리고, 취소
결과
실행5 MaxAbsScaler
실행6 StandardScalerWrapper
최고의 모델검토
평가메트릭을 기반으로 가장 좋은 모델이 식별됨
평가메트릭은 "정규화된 근 평균 제곱 오차" 기준으로 평가됨.
예측 값과 실제 값의 차이는 오차 의 양을 나타냅니다.
모델에서 이 특정 성능 측정 항목은
모든 테스트 사례에서 오류를 제곱하고 이러한 제곱의 평균을 찾은 다음 제곱근을 취하여 계산됩니다.
이 모든 것이 의미하는 바는이 값이 작을수록 모델이 더 정확하게 예측한다는 것입니다.
잔류 히스토그램 잔류 값 범위의 주파수를 나타낸다.
잔차는 모형에서 설명 할 수없는 예측 값과 실제 값 간의 차이를 나타냅니다. 즉, 오류입니다.
따라서 가장 빈번하게 발생하는 잔차 값이 0 주위 (즉, 대부분의 오류가 작음)로 군집되어 있으며 스케일의 끝에서 오류가 적습니다.
예상 대 트루 차트는 진정한 가치에있는 예측 값의 상관 관계 밀접하게 대각선 추세를 보여 주어야한다.
점선은 완벽한 모델의 성능을 보여 주며 모델의 평균 예측 값의 선이 값에 가까울수록 성능이 향상됩니다.
꺾은 선형 차트 아래의 히스토그램은 실제 값의 분포를 보여줍니다.
완료되면 배포?
엔드포인트URL 만들어지는데, 시간걸림.
http://136da5a5-2ee2-47b2-aee6-eff88906245a.eastus.azurecontainer.io/score
Sur2NTXTe2xVPNTr9qoybVdyxdKGet2R
JOKEkfK3fG8DWgyU7zGehN0vts0fP8fZ
노트북 생성
앞서 생성한 컴퓨팅 에서 구동함?
언어 지원
Python 3.6 AzureML
R
Python 3
구동 결과
5 일 동안 매일 예상 임대 수
끝.
이제 모두 삭제하자!
컴퓨팅 클러스터 삭제하고, 노트북 실행해보기
결과나옴.
컴퓨터 클러스터는 모델학습 구동할 때 쓰나봄?
'기술(Azure 만...) > [MS]Azure' 카테고리의 다른 글
azure signalR 실시간HTTP 서비스,라이브러리 (0) | 2021.04.26 |
---|---|
Azure vm 맬웨어 방지, Security Center (0) | 2021.01.01 |
Azure Automation의 업데이트 관리 (0) | 2020.05.15 |
IoT Edge 에지컴퓨팅 일반 (0) | 2020.05.13 |
Azure databricks (0) | 2020.04.19 |