[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 01. Machine Learning ์ฉ์ด์ ๊ฐ๋ ์ค๋ช
๋ชฉ์ฐจ
- Machine Learning(๋จธ์ ๋ฌ๋) ์ด๋?
- Supervised Learning / Unsupervised Learning
- Supervised learning์ ์ข
๋ฅ
- Regression(ํ๊ท)
- Classification(๋ถ๋ฅ)
Machine Learning(๋จธ์ ๋ฌ๋) ์ด๋?
๊ธฐ๊ณ ํ์ต(ๆฉๆขฐๅญธ็ฟ) ๋๋ ๋จธ์ ๋ฌ๋(์์ด: machine learning)์ ์ธ๊ณต ์ง๋ฅ์ ํ ๋ถ์ผ๋ก, ์ปดํจํฐ๊ฐ ํ์ตํ ์ ์๋๋ก ํ๋ ์๊ณ ๋ฆฌ์ฆ๊ณผ ๊ธฐ์ ์ ๊ฐ๋ฐํ๋ ๋ถ์ผ๋ฅผ ๋งํ๋ค.
-https://ko.wikipedia.org/wiki/%EA%B8%B0%EA%B3%84_%ED%95%99%EC%8A%B5
๋จธ์ ๋ฌ๋์ ์ผ์ข ์ ์ํํธ์จ์ด(ํ๋ก๊ทธ๋จ)์ด๋ค.
์ฌ์ฉ์์ ์ ๋ ฅ์ ๊ธฐ๋ฐ์ผ๋ก ๋ฐ์ดํฐ๋ฅผ ๋ณด์ฌ์ฃผ๋๋ก ํ๋ ํ๋ก๊ทธ๋๋ฐ, ๊ฐ๋ฐ์๊ฐ '์ด๋ฐ ํ๊ฒฝ์์ ์ด๋ ๊ฒ ๋ฐ์ํ๊ณ ๋ ๋ค๋ฅธ ํ๊ฒฝ์์๋ ์ ๋ ๊ฒ ๋ฐ์ํ๋ผ.'์ ๊ฐ์ด ์ค๊ณํ ํ๋ก๊ทธ๋๋ฐ์ explicit programming์ด๋ผ ํ๋ค.
๊ทธ๋ฐ๋ฐ ์ด๋ค ๋ถ๋ถ์์๋ explicit ํ๊ฒ ๊ตฌํํ๊ธฐ ์ด๋ ค์ด ๊ฒฝ์ฐ๊ฐ ์๋ค.
์๋ฅผ ๋ค์ด, ์ด๋ฉ์ผ ์คํธ ํํฐ ๊ฐ์ ๊ฒฝ์ฐ๋ ์คํธ์ ํด๋น๋๋ ๊ท์น๋ค์ด ๋๋ฌด ๋ง๊ธฐ ๋๋ฌธ์ ๊ฐ๋ฐ์๊ฐ ์์ํ๊ธฐ ์ด๋ ต๋ค.
๋ ๋ค๋ฅธ ์๋ก, ์ฌ๋ ์์ด ์๋์ฐจ๊ฐ ์์์ ์ฃผํํ๋ ์๋ ์ฃผํ ์ฐจ๋ ๊ฐ์ ๊ฒ์ ๊ฐ๋ฐ์๊ฐ ๊ท์น์ ์๊ณ ์ค๊ณํ๊ธฐ์ ๊ท์น๋ค์ด ๋~~๋ฌด๋ ๋ง๋ค.
1959๋ ๋ ๋ฏธ๊ตญ ์ปดํจํฐ ๊ณผํ์ Arthur Samuel์ด๋ผ๋ ์ฌ๋์ ์ด๋ฌํ ์๊ฐ์ ํ๋ค.
'์ฐ๋ฆฌ๊ฐ ์ผ์ผ์ด ํ๋ก๊ทธ๋๋ฐํ๋๊ฒ ์๋๋ผ,
์ด๋ค ์๋ฃ์์ ๋๋ ์ด๋ค ํ์์์ ์๋์ ์ผ๋ก ๋ฐฐ์ฐ๋ฉด ์ด๋จ๊น..? '
(Field of study that gives computers the ability to learn without being explicity programmed)
์ด๊ฒ์ด ๋ฐ๋ก ๋จธ์ ๋ฌ๋์ด๋ค.
์ฆ, ๊ฐ๋ฐ์๊ฐ ์๋ ํ๋ก๊ทธ๋จ ์์ฒด๊ฐ ๋ฐ์ดํฐ๋ฅผ ๋ณด๊ณ ํ์ตํด์ ๋ฐฐ์ฐ๋ ๊ฒ์ ๋จธ์ ๋ฌ๋์ด๋ผ ํ๋ค.
Supervised Learning, training set / Unsupervised Learning
๋จธ์ ๋ฌ๋์ ํ ๋ ํ๋ก๊ทธ๋จ์ ํ์ต์ ํด์ผํ๋ค. ํ์ต์ ํ๊ธฐ ์ํด์ ๋ฐ์ดํฐ๊ฐ ์ฃผ์ด์ ธ์ผ ํ๋๋ฐ ํ์ต์ ํ๋ ๋ฐฉ๋ฒ์๋
Supervised learning, Unsupervised learning์ด ์๋ค.
- Supervised learning
label๋ค์ด ์ ํด์ ธ์๋ ๋ฐ์ดํฐ(= training set)๋ฅผ ๊ฐ์ง๊ณ ํ์ต์ ํ๋ ๊ฒ์ Supervised learning์ด๋ผ ํ๋ค.
์๋ฅผ ๋ค์ด, ์ด๋ค ์ด๋ฏธ์ง๋ฅผ ์ฃผ๋ฉด ๊ทธ ์ด๋ฏธ์ง๊ฐ ๊ณ ์์ด์ผ๊น? ๊ฐ์ผ๊น? ์๋์ผ๋ก ์์๋ด๋ ํ๋ก๊ทธ๋จ์ด ์๋ค ๊ฐ์ ํ์.
(์ด ํ๋ก๊ทธ๋จ ์ญ์ ๋จธ์ ๋ฌ๋์ ํตํด ๋ง๋ค์ด์ง ํ๋ก๊ทธ๋จ์ผ ๊ฒ์ด๋ค)
์ฌ๋๋ค์ด ๊ณ ์์ด ๊ทธ๋ฆผ์ ์ฌ๋ฌ ๊ฐ ๋ชจ์์ ์ฃผ๊ณ ์ด ์ฌ์ง์ ๊ณ ์์ด๋ผ๊ณ (cat์ด๋ผ๋ label๋ฅผ ๋ถ์) ํ๋ก๊ทธ๋จ์๊ฒ ํ์ต์ํค๊ณ ๊ฐ ๊ทธ๋ฆผ์ ์ฌ๋ฌ ๊ฐ ๋ชจ์์ ์ด ์ฌ์ง์ ๊ฐ(dog๋ผ๋ label์ ๋ถ์)๋ผ๊ณ ํ๋ก๊ทธ๋จ์๊ฒ ํ์ต์ ์ํค๋ ๋ฐฉ์์ Supervised learning์ด๋ผ ํ ์ ์๊ฒ ๋ค.
- Training set
X | Y |
3, 6, 9 | 3 |
2, 5, 7 | 2 |
2, 3, 5 | 1 |
์ ํ์ ๊ฐ์ด Label(Y)์ด ์ ํด์ ธ ์๋ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ํ๋ก๊ทธ๋จ์ด ํ์ต์ ํ๋ฉด Model์ด ์๊ธด๋ค.
ํ์ตํ Model์ ๋ํด์, ์ฐ๋ฆฌ๊ฐ ๋ชจ๋ฅด๋ X๊ฐ ์๊ณ ๊ทธ ๊ฐ์ด X = [9, 3, 6] ๋ผ๊ณ ๊ฐ์ ํ๋ฉด ์ด X๋ฅผ ํ๋ก๊ทธ๋จ์๊ฒ ์ ๋ฌํ๋ฉด ํ๋ก๊ทธ๋จ์ ์๋ง Y๋ 3์ด๋ผ๊ณ ๋ตํ ๊ฒ์ด๋ค.
์ด๋ฌํ ํ์ต ๋ฐฉ๋ฒ์ Supervised learning์ด๋ผ ํ ์ ์๊ณ , ํ์ตํ ๋ฐ์ดํฐ(ํ)๋ฅผ training set์ด๋ผ ํ๋ค.
- Unsupervised learning
์์ Supervised learning๊ณผ ๋ฐ๋๋ก ์ผ์ผ์ด label์ ์ค ์ ์๋ ํํ๋ฅผ Unsupervised learning์ด๋ผ ํ๋ค.
์๋ฅผ ๋ค์ด, Google New๊ฐ ์๋๋ฐ, ์ด ๋ด์ค๋ ์๋์ ์ผ๋ก ์ ์ฌํ ๋ด์ค๋ค์ ๊ทธ๋ฃนํํ๋ค. ์ด๋ฐ ๊ฒฝ์ฐ์๋ label์ ๋ค ์ ํด์ฃผ๊ธฐ ์ด๋ ต๋ค. ๋ฐ๋ผ์ ์์์ ์ ์ฌํ ๋ด์ค๋ผ๋ฆฌ ๋ชจ์์ผ ํ๋ค.
๋ ๋ค๋ฅธ ์๋ก, ๋จ์ด๋ค ๊ฐ์ด๋ฐ๋ ๋น์ทํ ๋จ์ด๋ค์ ๋ชจ์ผ๋ ๋จธ์ ๋ฌ๋ ํ๋ก๊ทธ๋จ์ด ์๋ค๋ฉด ์ด ๊ฒฝ์ฐ๋ ์ญ์ label์ ๋ง๋ค์ด์ ํ์ต์ ์ํค๋ ๊ฒ์ด ์๋๋ผ ๋จ์ด๋ค์ ๊ฐ์ง๊ณ ์ค์ค๋ก ํ์ตํ๋ฏ๋ก Unsupervised learning์ด๋ผ ํ ์ ์๋ค.
Supervised learning์ ์ข ๋ฅ
Supervised learning์ ๋ฌธ์ ์ ํ์ ์ ๋ฐ๋ผ Regression problem, Classification problem๋ก ๋๋ ์ ์๋ค.
์ค๋ช ํ๊ธฐ ์ฝ๊ฒ ์ํ์ ์ฑ์ ์ ์์ธกํ๋ ์์คํ ์ด ์๋ค๊ณ ๊ฐ์ ํด๋ณด์.
- Regression
์ํ ์ ์์ ๋ฒ์๋ 0์ ๋ถํฐ 100์ ๊น์ง ๋์ ๋ฒ์๋ฅผ ๊ฐ์ง๊ณ ์์ ํ ๋ฐ(continous ํ ์ฐ์์ฑ์ ๊ฐ๊ณ ์๋๋ฐ) ์ด๋ฐ ์์ธก์ ํ๋ ๊ฒ์ Regression์ด๋ผ ํ ์ ์๋ค.
x (hours) | y (score) |
10 | 90 |
9 | 80 |
3 | 50 |
2 | 30 |
๋ค์๊ณผ ๊ฐ์ ๋ฐ์ดํฐ๋ฅผ ํ์ต์์ผฐ์ ๋, ์ฐ๋ฆฌ๊ฐ x = 7์ด๋ผ๊ณ ์ง๋ฌธํ๋ฉด ํ๋ก๊ทธ๋จ์ y = 75์ ๊ฐ์ด ์์ธกํ ์ ์๋,
์ฆ Continouse ํ ๋ฐ์ดํฐ๋ฅผ ๊ฐ์ง๊ณ ํ์ตํ์ฌ ๊ฒฐ๊ณผ๋ฅผ ์์ธกํ ์ ์๋ ๋ชจ๋ธ์ Regression ๋ชจ๋ธ์ด๋ผ ํ ์ ์๋ค.
- Classification
Classification์ Regression๊ณผ๋ ๋ฌ๋ฆฌ ์ฐ์์ฑ์ด ์์ด ๋ช ๊ฐ์ง ๊ฐ์ผ๋ก ๋์ด์ง๋ ๊ฒฝ์ฐ๋ค.
Classification์ ์ข ๋ฅ๋ Binary classification, Multi-label classification์ผ๋ก ๋ถ๋ฅํ ์ ์๋ค.
Binary classification
๋ฌธ์ ๋ฅผ ๋จ์ํ์์ผ์ ์ ์๋ก ๋ถ๋ฅํ์ง ๋ง๊ณ , ์ํ์ด PASS๋ FAIL์ด๋ ๋ ๊ฐ์ง๋ก ๋๋์ด์ ์์ธก์ ํ๋ ๊ฒ์ Binary classification์ด๋ผ ํ๋ค.
x (hours) | y (pass/fail) |
10 | P |
9 | P |
3 | F |
2 | F |
Multi-label classification
์ด๋ฒ์๋ ์ํ์ ๋ค์๊ณผ ๊ฐ์ด A, B, C, E, F๋ผ๋ ํ์ ์ผ๋ก, ์์ธกํ ์ ์๋ ๋ฒ์๋ฅผ ์ข ๋ ์ฌ๋ฌ ๊ฐ๋ก ๋๋๋ ๊ฒ์ Multi-label classification์ด๋ผ ํ๋ค.
x (hours) | y (gradel) |
10 | A |
9 | B |
3 | D |
2 | F |
์ฐธ๊ณ ์๋ฃ
https://www.youtube.com/watch?v=qPMeuL2LIqY
KimSung๋ - ML lec 01. ๊ธฐ๋ณธ์ ์ธ Machine Learning ์ ์ฉ์ด์ ๊ฐ๋ ์ค๋ช
https://bcho.tistory.com/966
์กฐ๋ํ๋ ๋ธ๋ก๊ทธ
'Development > Machine Learning' ์นดํ ๊ณ ๋ฆฌ์ ๋ค๋ฅธ ๊ธ
๋๊ธ
์ด ๊ธ ๊ณต์ ํ๊ธฐ
-
๊ตฌ๋
ํ๊ธฐ
๊ตฌ๋ ํ๊ธฐ
-
์นด์นด์คํก
์นด์นด์คํก
-
๋ผ์ธ
๋ผ์ธ
-
ํธ์ํฐ
ํธ์ํฐ
-
Facebook
Facebook
-
์นด์นด์ค์คํ ๋ฆฌ
์นด์นด์ค์คํ ๋ฆฌ
-
๋ฐด๋
๋ฐด๋
-
๋ค์ด๋ฒ ๋ธ๋ก๊ทธ
๋ค์ด๋ฒ ๋ธ๋ก๊ทธ
-
Pocket
Pocket
-
Evernote
Evernote
๋ค๋ฅธ ๊ธ
-
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 02. TensorFlow๋ก Linear regression ๊ตฌํ
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 02. TensorFlow๋ก Linear regression ๊ตฌํ
2019.07.04 -
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 02. Linear Regression์ Hypothesis์ Cost
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 02. Linear Regression์ Hypothesis์ Cost
2019.07.04 -
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 01. TensorFlow์ ๊ธฐ๋ณธ์ ์ธ operations
[๋จธ์ ๋ฌ๋ ์ ๋ฌธ] 01. TensorFlow์ ๊ธฐ๋ณธ์ ์ธ operations
2019.07.01 -
[๋จธ์ ๋ฌ๋] ํ์ด์ฌ(Python), ํ ์ํ๋ก์ฐ(Tensor Flow) ์ค์น
[๋จธ์ ๋ฌ๋] ํ์ด์ฌ(Python), ํ ์ํ๋ก์ฐ(Tensor Flow) ์ค์น
2019.06.28