[머신러닝]-기본적인-용어와-개념(feat.-모두를-위한-딥러닝,-Sung-Kim)

Aug 3, 2018


  • Supervised learning

  • training set 을 가지고 학습하는 것.

  • 개 인지 고양이 인지 판별하는 것, label이 달려있는 데이터.

  • Image labeling, Email spam filter, Predicting exam score

#Training data set

label 을 갖는 데이터 x, y를 가지고 학습을 시키고 예측값을 얻어낸다.

#AlphaGo

알파고에 Training data set을 통해서 학습을 시키고 예측값을 내놓는다.

  • Regression : 기말고사 시험 점수를 예측한다.

x (hours)

y (score)

10

90

9

80

3

50

2

30

위 학습 데이터를 가지고 몇시간 공부 했을 때 몇점이 나오는지 예측.

  • Binary Classification : Pass or Non-Pass

x (hours)

y (pass/fail)

10

P

9

P

3

F

2

F

위 학습 데이터를 가지고 Pass or Non-Pass를 판별.

  • Multi-label Classification : A, B ,C ,E and F로 기반으로 예측.

x (hours)

y (grade)

10

A

9

B

5

D

3

F

*Unsupervised learning

  • Google news, Word clustering.

  • 데이터를 보고 직접 학습한다.

  1. TensorFlow
  • open source software library for **numerical computation using data flow graphs. **(with, python)

**
**

*** **Data Flow Graph

  • 그래프, 노드와 노드를 연결하는 엣지로 구성

  • 노드 : operation (더하기, 곱하기 등의 연산)

  • 엣지 : 데이터

  • 데이터 플로우 그래프에서 데이터가 굴러다니면서 연산이 이루어진다.

*Max OS 설치 (terminal)

설치

  • (python3) $ sudo -H pip3 install –upgrade tensorflow

확인

  • $ python3

  • import tensorflow as tf

tf _ _version_ _

  • TensorFlow Mechanics (텐서플로우 실행 과정)

1) 텐서플로우 연산에 사용되는 그래프를 생성, 노드들과 엣지 빌드.

2) 데이터를 넣거나 연산을 실행, ‘sess.run(op)’ => 그래프 실행.

3) 결과 출력.

  • Tensor

  • 데이터가 들어있는 배열이다.

  • Rank

  • 차원, 1차원 배열, 2차원 배열

  • Shape

  • 각각의 차원에 몇개의 엘리먼트를 가지고 있냐

  • [[1, 2, 3], [4, 5, 6], [7, 8, 9]] => [3(큰 집단), 3(큰 집단 안에 엘리먼트 갯수)]

**
**