๊ธ€ ์ž‘์„ฑ์ž: ๋˜ฅํด๋ฒ .
๋ฐ˜์‘ํ˜•

๋ชฉ์ฐจ


  • Linear Regression
  • Cost function

 

Linear Regression


์šฐ๋ฆฌ๊ฐ€ ์˜ˆ์ธก์„ ํ•˜๋ ค๋Š” ์ตœ์ข… ๋ชฉํ‘œ๊ฐ€ ์ ์ˆ˜(0์ ์—์„œ 100์  ์‚ฌ์ด)๋ผ๊ณ  ํ•  ๋•Œ ์ด๋Ÿฐ ํ˜•ํƒœ์˜ ๋จธ์‹  ๋Ÿฌ๋‹์€ Supervised Learning ์ค‘์—์„œ๋„ Regression์ด๋ผ ํ•  ์ˆ˜ ์žˆ๋‹ค.

x (hours) y (score)
10 90
9 80
3 50
2 30

์œ„์™€ ๊ฐ™์€ ๋ฐ์ดํ„ฐ๋ฅผ ํ†ตํ•ด ํ•™์Šต์„ ์‹œํ‚ค๋Š” ๊ฒƒ์„ training์ด๋ผ ํ•˜๊ณ ,

training์ด ๋๋‚œ ํ›„์— Regression์„ ์‚ฌ์šฉํ•œ๋‹ค๋Š” ๊ฒƒ์€ ์–ด๋–ค ํ•™์ƒ์ด

'๋‚˜๋Š” 7์‹œ๊ฐ„ ์ •๋„ ๊ณต๋ถ€ํ–ˆ๋Š”๋ฐ ๋ช‡ ์ ์ด๋‚˜ ๋ฐ›์„ ์ˆ˜ ์žˆ์„๊นŒ..?'

์งˆ๋ฌธ์„ ํ•œ๋‹ค๊ณ  ํ•˜๋ฉด ์ˆ˜ํ•™์ ์œผ๋กœ๋Š” x๋ผ๋Š” ๊ฐ’์— 7์„ ๋˜์ง€๊ณ  Regression์ด ๊ฒฐ๊ณผ(y)๋ฅผ์˜ˆ์ธก์„ ํ•ด์ฃผ๋Š” ๊ฒƒ์„ ๋งํ•œ๋‹ค.

[๊ทธ๋ฆผ1] (Linear) Hypothesis

์œ„์˜ ์™ผ์ชฝ ํ‘œ์™€ ๊ฐ™์€ ๊ฐ„๋‹จํ•œ Traning Data๊ฐ€ ์žˆ๋‹ค๊ณ  ๊ฐ€์ •ํ•˜๋ฉด ๊ทธ๋ž˜ํ”„๋Š” ์˜ค๋ฅธ์ชฝ ๊ทธ๋ฆผ๊ณผ ๊ฐ™๋‹ค.

์šฐ๋ฆฌ๊ฐ€ ์ด๋Ÿฌํ•œ Regression Model์„ training ํ•œ๋‹ค๋Š” ๊ฒƒ์€ ํ•˜๋‚˜์˜ ๊ฐ€์„ค์„ ์„ธ์šธ ํ•„์š”๊ฐ€ ์žˆ๋‹ค.

์„ธ์ƒ์— ์žˆ๋Š” ๋งŽ์€ ํ˜„์ƒ๋“ค์ด Linearํ•˜๊ฒŒ ์„ค๋ช…๋˜๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋งŽ์ด ์žˆ๋‹ค.

(ex. ํ•™์ƒ์ด ๊ณต๋ถ€๋ฅผ ๋งŽ์ด ํ• ์ˆ˜๋ก ์„ฑ์ ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค, ์ง‘์˜ ํฌ๊ธฐ๊ฐ€ ํฌ๋ฉด ํด์ˆ˜๋ก ๊ฐ€๊ฒฉ์ด ์˜ฌ๋ผ๊ฐ„๋‹ค,...)

์šฐ๋ฆฌ๊ฐ€ Linear ํ•˜๊ฒŒ Hypothesis(๊ฐ€์„ค)์„ ์„ธ์šด๋‹ค๋Š” ๊ฒƒ์€ ์šฐ๋ฆฌ๊ฐ€ ์–ด๋–ค ๋ฐ์ดํ„ฐ๊ฐ€ ์žˆ๋‹ค๋ฉด ์šฐ๋ฆฌ๋Š” Linear ํ•œ ์„ ์„ ์ฐพ๋Š”๋‹ค๋ผ๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

[๊ทธ๋ฆผ2] ์–ด๋–ค ์„ ์ด ์šฐ๋ฆฌ์˜ ๋ฐ์ดํ„ฐ์— ์ž˜ ๋งž๋Š” ์„ ์ผ๊นŒ?

[๊ทธ๋ฆผ 2]์™€ ๊ฐ™์ด ์—ฌ๋Ÿฌ ๊ฐœ์˜ ์„ ์„ ๊ทธ์„ ์ˆ˜ ์žˆ๋Š”๋ฐ, ๋ฐ์ดํ„ฐ์— ๊ฐ€์žฅ ์ž˜ ๋งž๋Š” ์„ ์„ ์ฐพ๋Š” ๊ฒƒ์ด ๋ชฉํ‘œ๋ผ ํ•  ์ˆ˜ ์žˆ๋‹ค.

H(x) = Wx + b

์šฐ๋ฆฌ์˜ Hypothesis(๊ฐ€์„ค)์€ ์œ„์˜ 1์ฐจ ๋ฐฉ์ •์‹์œผ๋กœ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค. ์ด๊ฒƒ์ด Linear Regression์˜ ์ฒซ ๋ฒˆ์งธ ๋‹จ๊ณ„์ด๋‹ค

๊ทธ๋‹ค์Œ ๋ฐ์ดํ„ฐ์™€ ๊ฐ€์žฅ ์ž˜ ๋งž๋Š” ์„ ์„ ์ฐพ์•„์•ผ ํ•œ๋‹ค. ์ฆ‰ W์™€ b๋ฅผ ์ฐพ๋Š” ๊ฒƒ์ด ์šฐ๋ฆฌ์˜ ๋ชฉํ‘œ๋‹ค.

์œ„์˜ ๋ฐ์ดํ„ฐ์—์„œ๋Š” W๊ฐ€ 1, b๊ฐ€ 0์ผ ๋•Œ ๊ฐ€์žฅ ์ž˜ ๋งž๋Š”๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค. (H(x) = x)

 

Cost function


[๊ทธ๋ฆผ3] ์–ด๋–ค ๊ฐ€์„ค์ด ๋” ์ž˜ ๋งž๋Š”๊ฐ€?

์‹ค์ œ ๋ฐ์ดํ„ฐ์™€ ์šฐ๋ฆฌ์˜ ๊ฐ€์„ค์ด ๋‚˜ํƒ€๋‚ด๋Š” ๋ฐ์ดํ„ฐ์˜ ๊ฑฐ๋ฆฌ๋ฅผ ๋น„๊ตํ•˜์—ฌ ๊ฑฐ๋ฆฌ๊ฐ€ ์งง์œผ๋ฉด ์งง์„์ˆ˜๋ก ๊ฐ€์„ค์ด ์ž˜ ๋งž๋Š”๋‹ค๊ณ  ๋ณผ ์ˆ˜ ์žˆ๋‹ค.

์šฐ๋ฆฌ์˜ ์„ (1์ฐจ ๋ฐฉ์ •์‹)์ด ์–ผ๋งˆ๋‚˜ ๋ฐ์ดํ„ฐ์™€ ๋” ์ž˜ ๋งž๋Š”์ง€ ๊ณ„์‚ฐํ•˜๋Š” ๊ฒƒ์„ Cost function(=Loss function)์ด๋ผ ํ•˜๊ณ  ๋‹ค์Œ๊ณผ ๊ฐ™์ด ๋‚˜ํƒ€ ๋‚ผ ์ˆ˜ ์žˆ๋‹ค.

H(x) - y

์ด ์‹์—์„œ, ์ฐจ์ด์—์„œ ์ƒ๊ฒจ๋‚˜๋Š” ๋ถ€๋“ฑํ˜ธ(์Œ์ˆ˜)๋ฅผ ์—†์• ์ฃผ๊ธฐ ์œ„ํ•ด ์ œ๊ณฑ์„ ํ•ด์ค€๋‹ค.

(H(x) - y)^2

 

์ข€ ๋”, formal ํ•˜๊ฒŒ ์ •๋ฆฌํ•ด๋ณด์ž๋ฉด ๊ทธ๋ฆผ 3 ๋ฐ์ดํ„ฐ์˜ Cost function์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค๊ณ  ํ•  ์ˆ˜ ์žˆ๋‹ค.

[๊ทธ๋ฆผ4] ๊ทธ๋ฆผ 3์˜ Cost function

๊ฐ ๋ฐ์ดํ„ฐ ๊ฑฐ๋ฆฌ์˜ ์ฐจ๋ฅผ ์ œ๊ณฑํ•ด์„œ ๋ชจ๋‘ ๋”ํ•˜๊ณ  ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜๋งŒํผ ๋‚˜๋ˆ„๋ฉด Cost function์ด ๋œ๋‹ค.

[๊ทธ๋ฆผ5] Cost function

์ผ๋ฐ˜์ ์ธ Cost function์˜ ๋ชจ์Šต์ด ์™„์„ฑ๋˜์—ˆ๋‹ค. ์—ฌ๊ธฐ์„œ m๋Š” ํ•™์Šต ๋ฐ์ดํ„ฐ์˜ ๊ฐœ์ˆ˜๋ฅผ ๋œปํ•œ๋‹ค.

[๊ทธ๋ฆผ 6] Cost function

์—ฌ๊ธฐ์„œ H(x)๋Š” ์šฐ๋ฆฌ์˜ Hypothesis(๊ฐ€์„ค)์ด๊ณ  W์™€ b์— ๋”ฐ๋ผ ๊ทธ ๋ชจ์–‘์ด ๋‹ฌ๋ผ์ง€๊ธฐ ๋•Œ๋ฌธ์—

Cost function์€ cost(W, b)๋ผ๊ณ  ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค.

 

cost๋ฅผ ๊ฐ€์žฅ ์ ๊ฒŒ ํ•˜๋Š” ๊ฒƒ์€ ์šฐ๋ฆฌ๊ฐ€ ์ž…๋ ฅํ•œ ๋ฐ์ดํ„ฐ์™€ ๊ฐ€์žฅ ์œ ์‚ฌํ•œ Linear ํ•œ ์„ ์„ ์ฐพ๋Š” ๊ฒƒ์ด๊ณ  ๊ทธ๊ฒƒ์ด ์šฐ๋ฆฌ์˜ ์ตœ์ข… ๋ชฉํ‘œ๋‹ค.

 

์ฐธ๊ณ ์ž๋ฃŒ


https://www.youtube.com/watch?v=Hax03rCn3UI
Sung Kim- ML lec 02.Linear Regression์˜ Hypothesis์™€ cost ์„ค๋ช…
๋ฐ˜์‘ํ˜•