DB는 데이터브릭스 약자

 

DB 워크스페이스 

DB 워크플로우 

DB 런타임 

DB IO 

DB 서버리스 

DBES(데이터브릭스 엔터프라이즈 시큐리티)  

 

왼쪽 데이터 원본 - DB - ML, DW, BI   

 

Free azure 구독에서도, 14일 트라이얼 사용가능??

 

<실습>

1. DB생성 (Vnet peer 기능있네) 

 

2. SA생성 

 

3. DB 클러스터생성(DB버전 선택(스파크버전), 파이썬버전 선택 , 워커타입, 드라이버 타입, 오토스케일옵션) 

마스터서버 : 오케스트레이션 

워커서버 : 스크립트가 실제 구동되는   

 

4. 워크스테이스로 이동, 계정선택 후 노트북생성(파이썬) 

 

5. notebook에 예제 스크립트 입력 cmd1
cmd2 
 SA지정,컨테이너,토큰 등등 입력 후 개별 실행도 가능.

상단에 run all  기능

sql쿼리문도 실행가능....

다양한 챠트로 보기 가능함. 

피벗테이블도 있음.    

 

 

<다른 notebook> 

1. SA - 컨테이너 에 json 파일 , SAS정의 

2. 노트북 생성, cmd1에서 변수 정의 1번의 json파일 

3. cmd2 에서. 해당 blob 마운트 

4. json 호출 var df = spark.read.json("/mnt/블라브라.json") 

5. df.select(컬럼명, 컬럼명...) 해서 display함수 부르면 출력됨. 

6. 각종 sql 쿼리문 실행가능 count(*) 등 

7. 최종결과를 csv로 쓰기 가능 어디에? blob에 쓰기  

 

 

Azure Databricks Tutorial | Data transformations at scale  

 

 

 

 

 




'기술(Azure 만...) > [MS]Azure' 카테고리의 다른 글

Azure Automation의 업데이트 관리  (0) 2020.05.15
IoT Edge 에지컴퓨팅 일반  (0) 2020.05.13
2020.02 ~ 03 azure update 요약  (0) 2020.03.03
QnA maker 테스트  (0) 2020.01.29
Microsoft Attack Surface Analyzer 2.0  (0) 2020.01.13

+ Recent posts