파이썬 없이 빅데이터 분석하기
교육 목표
- 머신러닝 기술을 쉽게 배워서 활용할 수 있는 과정
- 연구자가 아닌 사용자 관점의 교육
교육 내용
- 머신 러닝 기초
- 지루한 코딩 작업, 복잡한 수학 및 배경 지식 교육 배제(?)
- 문제를 푸는 기술이 아닌 문제를 정의하고 이해하는 방식에 집중
- 초급 단계에서 바로 이해하고 활용 가능한 수준 배양 목표
- 배워서 바로 활용하고, 학습 수준에 맞추어 점차적인 이론 심화 학습
1일차 교육 (08-22, 10:00)
- 데이터 마이닝 툴인
오렌지(Orange)
사용 - 자료 채굴 도구라니 광부???
- 현재는 무질서하게 흩어져 있는 다양한 형태의 정보로부터
- 다양한 데이터로부터 가치(Value)를 끌어내는 것
- 대규모로 저장된 데이터 안에서 체계적이고 자동적으로 규칙이나 패턴을 찾아내는 것
- 분류 Classification
- 군집화 Clustering
- 연관성 Association
- ...
- 방법 : 알고리즘, 머신러닝 ...
- 좋은 방법과 도구가 존재할 때, 어떻게 쉽게 가능하게 사용할 수 있을까?
- 인공지능의 역사
- 통계학 - 컴퓨터 공학 - 기계학습(machine learning) - data mining(big data)
- 인간의 인지/사고/행동 학습 강조
- Rule Based System / Neural Network
- 비쥬얼 데이터 마이닝 - 시각화 기술 (그래프 ...) VDM
- VDM 도구로 짧은 시간에 데이터 분석 실무를 익히고, 실제 업무에 투입 가능
- Interactive Data Visualization
- Visual Programming
- 데이터 시각화를 통해 손쉬운 의사소통
- AI > ML > DL
- 딥러닝 - 사람의 인식체계를 모방
- 견본을 통한 학습(Learning from examples)
- 관찰된 정보를 바탕으로 규칙을 찾는 행위
- 정보를 관찰, 관찰 후 분석 - 규칙적 또는 불규칙적
- 가장 쉽고 간단한 방법으로 분석 : 오컴의 면도날 (Ockham's razor)
- 일관된 가설이 여러개일때 가장 단순한 것을 선호
- 의사 결정 트리의 학습 (Learning Decision Trees)
- 선형 모형을 이용한 회귀와 분류
- 선형 회귀 (Linear Regression)
머신러닝