KNIME Quickstart Guide : 첫번째 워크플로우 만들기 (한글 버전) KNIME

KNIME에서 2018년 12월 13일에 발행된 KNIME Quickstart Guide 문서를 번역하였습니다. 

4. 첫번째 워크플로우 만들기

이제 영업(Sales) 데이터를 분석하는 워크 플로 예제를 작성해 보겠습니다. 작업이 끝나면 그림 4와 같은 워크 플로우처럼 보입니다. 망치더라도 걱정하지 마세요. 공개 예제 서버(Example Server)에 있는 02_ETL_Data_Manipulation/00_Basic_Examples/00_Visual_Analysis_of_Sales_Data에 워크플로우를 사용할 수 있습니다.
그림 4. 예제 워크플로우

그림 4의 워크플로우 예제는 CSV 파일에서 데이터를 읽고 열(column)의 부분(subset)을 필터링하고 일부 행(row)을 필터링 한 다음 그림 5와 같이 누적 영역 차트와 원형 차트, 두 가지 그래프로 시각화합니다. 왼쪽 그래프는 시간이 지남에 따라 매출의 발전을 보여주고 오른쪽 그래프는 총 매출에 대한 각국의 점유율을 보여줍니다.
그림 5. 예제 워크플로우의 결과 시각화

시작하려면 먼저 워크 플로우에서 사용할 데이터가 포함 된 CSV 파일을 다운로드하십시오. 그런 다음 New KNIME Workflow 수행하여 빈 워크플로우를 새로 만듭니다.
  • KNIME Workbench 상단의 도구 모음 패널에서 새로 만들기를 클릭합니다.
  • 또는 그림 6과 같이 KNIME Explorer에서 로컬 작업 공간의 폴더를 마우스 오른쪽 버튼으로 클릭합니다.

그림 6. 비어있는 새로운 워크플로우 만들기

첫 번째 노드는 노드 저장소에서 찾을 수있는 파일 읽기(File Reader) 노드입니다. IO → Read → File Reader로 이동하거나 노드 저장소 패널의 검색 상자에 이름의 일부를 입력 할 수 있습니다.

워크플로우에서 노드를 사용하려면 다음 중 하나를 수행 할 수 있습니다.
  • 노드 저장소에서 워크플로우 편집기로 드래그 앤 드롭하십시오.
  • 또는 노드 저장소에서 노드를 두 번 클릭하십시오. 워크플로우 편집기에 자동으로 나타납니다.
이제 이 노드에 대한 설정을 해 보겠습니다.

노드를 더블 클릭하거나, 오른쪽 마우스 클릭해서 configuration을 클릭하여 구성 대화 상자 (configuration dialog)를 그림 7과 같이 엽니다. 

그림 7. File Reader 노드 설정하기

구성 대화 상자에서 찾아보기 단추(Browse)를 클릭하여 파일 경로를 설정한 다음 다른 설정을 확인하고 그림 8과 같이 데이터를 미리 봅니다.

그림 8. File Reader 노드의 구성 대화 상자

이제 출력 테이블을 검사하며 데이터 파일을 의도 한대로 읽었는지 확인할 수 있습니다. 
출력 테이블을 검사하려면 :
  • 노드를 마우스 오른쪽 단추로 클릭하고 실행(Excuete)을 선택하여 File Reader 노드를 실행합니다.
  • 실행 된 노드를 마우스 오른쪽 버튼으로 클릭하고 메뉴에서 마지막 옵션(File Table)을 선택하여 출력 테이블을 엽니다.

데이터를 올바르게 읽은 경우 Column Filter 노드를 워크 플로 편집기에 추가하고 File Reader 노드에 연결합니다.
  • File Reader 노드의 출력 포트에서 Column Filter 노드의 입력 포트로 드래그(drag)합니다.
  • 또는 워크 플로우에서 File Reader 노드를 한 번 클릭 한 다음 노드 저장소(node repository)에서 Column Filter 노드를 두 번 클릭합니다. 이 방법은 자동으로 Column Filter 노드를 File Reader 노드에 연결합니다.

계속 진행하기 전에 Column Filter 노드를  구성(configure)을 설정해야합니다.
  • 녹색 프레임의 Include 필드로 두 번 클릭하거나 그림 9의 구성 대화 상자에서 Exclude와 Include 필드 사이의 버튼을 사용하여 "country", "date"및 "amount" 열을 이동하십시오.
그림 9. Column Filter 노드의 구성 대화 상자
  • 확인을 클릭하여 구성을 마칩니다.

워크 플로우 구축을 계속하겠습니다. 
  • 워크플로우 편집기에 Row Filter 노드를 추가하여 Column Filter 노드와 연결합니다.
  • 행 필터 노드의 구성 대화 상자를 열고, 그림 10에서와 같이 "country" 열의 값이 "unknown"인 행을 입력 테이블에서 제외합니다
그림 10. Row Filter 노드의 구성 대화 상자

이제 데이터가 필터링이 끝났음으로 데이터 시각화로 넘어 가겠습니다.
  • 노드 저장소에서 Stacked Area Chart (JavaScript) 및 Pie / Donut Chart (JavaScript)를 검색하여 워크 플로우 편집기에 추가하십시오. 둘 다 Row Filter 노드에 연결합니다.
  • Stacked Area Chart (JavaScript) 노드의 구성 대화 상자를 엽니 다. 그림 11에서와 같이 x 축 열로 "date"열을 선택하십시오.
그림 11. Stacked Area Chart (JavaScript) 노드의 구성 대화 상자
  • 이제 Pie / Donut Chart (JavaScript) 노드의 구성 대화 상자를 열고, 범주 열로 "country", 집계 방법으로 "Sum", 원형 차트에 빈도 열로 "amount"를 선택하십시오. 이러한 구성 옵션은 그림 12에 나와 있습니다.
그림 12. Pie / Donut Chart (JavaScript) 노드의 구성 대화 상자

워크 플로가 완료되고 다음 단계로 실행하고 출력을 봅니다. 또는 그림 13의 툴바에서 "Executable all node" 버튼을 클릭합니다.

그림 13. 툴바의 Executable all node

또는 워크 플로우의 서로 다른 분기의 마지막 노드들을 선택하고 마우스 오른쪽 단추로 클릭 한 다음 메뉴에서 실행을 클릭 합니다.

JavaScript기반 노드의 대화형 출력 보기를 하려면 :
  • 그림 14와 같이 실행되지 않은 노드에 대해 Execute and Open Views 옵션을 선택하십시오.
그림 14. 대화 형보기 실행 및 열기

  • 또는 그림 15와 같이 실행된 노드에 마우스 오른쪽 단추로 클릭하고 대화식 보기를 선택하십시오.
그림 15. 실행 된 노드의 대화형 보기 열기

현재 원형 차트는 데이터의 여러 국가에 기본 색상을 사용합니다. Color Manager 노드를 사용하면 그림 5에서 볼 수있는 기본 색상 이외의 색상을 국가에 지정할 수 있습니다. 그래프를 작성하기 전에 색상을 지정해야하므로 Color Manager 노드를 중간에 추가해야합니다.

Color Manager 노드를 추가합니다.
  • 노드 저장소에서 노드를 드래그하고 그림 16과 같이 연결이 빨간색으로 바뀌면 워크플로우의 행 필터 노드와 파이/도넛 형 차트 노드 사이의 해당 위치에 놓습니다. 빨간색 연결은 마우스를 놓을 때 새 노드를 수락 할 준비가 되었음을 의미합니다.
그림 16. 워크 플로우의 두 노드 사이에 노드 삽입



핑백

  • Toy Lake : KNIME Quickstart Guide 종합 (한글 번역) 2019-06-25 17:26:52 #

    ... IME Quickstart Guide 문서를 번역하였습니다. 1. 소개2. KNIME 분석 플랫폼 시작하기3. 노드와 워크플로우4. 첫번째 워크플로우 만들기5. 예제 워크플로우6. 확장과 통합7. 사용팁과 요령 원본문서 다운받기 ... more

덧글

댓글 입력 영역

와이드 애드센스