ADF
데이터 이동을 오케스트레이션하고 대규모로 데이터를 변환하기 위해 데이터 기반 워크플로를 만들 수 있는 클라우드 기반 ETL 및 데이터 통합 서비스
워크플로 = 파이프라인
요즘엔 ETL -> ELT
즉, 변환없이 바로 로드 가능
ELT의 장점은 JSON, XML, PDF 또는 이미지 등 원래 형식으로 데이터를 저장가능
즉, 데이터를 가져와 가공하여 DW에 모아줌.
이후 Azure Databricks 또는 HDInsight 로 데이터분석 작업
-연결
-수집
-변환
-보강
-DW에 게시
-파이프라이 모니터링
# Sign in to Azure and set the WINDOWS AZURE subscription to work with
$SubscriptionId = "add your subscription in the quotes"
Add-AzureRmAccount
Set-AzureRmContext -SubscriptionId $SubscriptionId
# register the Microsoft Azure Data Factory resource provider
Register-AzureRmResourceProvider -ProviderNamespace Microsoft.DataFactory
# DEFINE RESOURCE GROUP NAME AND LOCATION PARAMETERS
$resourceGroupName = "cto_ignite"
$rglocation = "West US 2"
# CREATE AZURE DATA FACTORY
New-AzureRmDataFactoryV2 -ResourceGroupName $resourceGroupName -Name "ctoigniteADF" -Location $rglocation
제어 작업이 생각보다 많네
1. ForEachActivity
ForEach 작업은 파이프라인의 반복 제어 흐름을 정의합니다. 이 작업을 사용하여 컬렉션을 반복하고 루프의 지정된 작업을 실행합니다. 이 작업의 루프 구현은 프로그래밍 언어에서 구조를 반복하는 Foreach와 비슷합니다.
2. WebActivity 웹 작업
Data Factory 파이프라인에서 사용자 지정 REST 엔드포인트를 호출하는 데 사용할 수 있습니다. 작업에서 사용하고 액세스하도록 데이터 세트 및 연결된 서비스를 전달할 수 있습니다.
3. 조회 작업 조회 작업을 사용하면 모든 외부 소스에서 레코드/테이블 이름/값을 읽거나 조회할 수 있습니다. 이 출력을 다음 작업에서 추가로 참조할 수 있습니다.
4. 메타데이터 작업 가져오기 GetMetadata 작업을 사용하면 Azure Data Factory에 있는 모든 데이터의 메타데이터를 검색할 수 있습니다.
5. Until 작업
프로그래밍 언어의 Do-Until 루핑 구조와 유사한 Do-Until 루프를 구현합니다. 작업과 관련된 조건이 참으로 평가될 때까지 일단의 반복 작업을 실행합니다. Data Factory에서 until 작업의 시간 제한 값을 지정할 수 있습니다.
6. If 조건 작업
If 조건을 사용하여 True 또는 False로 평가되는 조건을 기반으로 분기할 수 있습니다. If 조건 작업은 if 문에서 프로그래밍 언어로 제공하는 것과 동일한 기능을 제공합니다. 조건이 true로 평가되면 작업 집합을 평가하고, 조건이 false로 평가되면 다른 작업 집합을 평가합니다.
7. Wait 작업
파이프라인에서 대기 작업을 사용하는 경우 파이프라인은 후속 작업을 계속 실행하기 전에 지정된 기간 동안 대기합니다.
IR설치 시 포트 오픈 관련
https://docs.microsoft.com/en-us/azure/data-factory/create-self-hosted-integration-runtime?tabs=data-factory#ports-and-firewalls
'기술(Azure 만...) > Azure빅데이터,분석' 카테고리의 다른 글
Power BI 기본요소들 (0) | 2022.01.16 |
---|---|
Azure Synapse Analytics 또 요약 (0) | 2021.11.14 |
KepserverEX - Iot Edge - Iot Hub (0) | 2021.07.16 |
DW, ADF, Synapse Analytics 복습 (0) | 2021.03.01 |
데이터분석 기초 (0) | 2020.09.09 |