2-9 ์ฑํฐ์์๋ DNN ์ ์ํ supervised learning ์ ํ๋ ๋ฐฉ๋ฒ์ ๋ํด ๊ณต๋ถํ์๋ค. ํ์ง๋ง ๊ธฐ์กด์ ์ฑํฐ์์๋ ์
๋ ฅ๊ณผ ์ถ๋ ฅ์ ์ฐ๊ฒฐํ๋ ํ๋์ ๋ฐฉ๋ฒ์ธ fully-connected layers์ ๋ํด์๋ง ๋ค๋ฃจ์๋ค. ์ฑํฐ 10-13 ์์๋ ์ฃผ๋ก ์ด๋ฏธ์ง ํ๋ก์ธ์ฑ์ ์ฌ์ฉ๋๋ sparse connections
, shared weights
๊ทธ๋ฆฌ๊ณ parallel processing paths
๋ฑ์ ํฌํจํ๋ ๋ ํน๋ณํ ์ปดํฌ๋ํธ๋ค์ ์๊ฐํ๋ค.
์ด๋ฏธ์ง๋ ํน๋ณํ ๋คํธ์ํฌ ๊ตฌ์กฐ๋ฅผ ํ์๋กํ๋ 3๊ฐ์ง ํน์ฑ์ด ์๋ค.
Convolution layers ๋ ์ ์ฒด ์ด๋ฏธ์ง๊ฐ ๊ณต์ ํ๋ ํ๋ผ๋ฏธํฐ๋ค๋ก ๊ฐ ์ด๋ฏธ์ง์ local region์ ๋
๋ฆฝ์ ์ผ๋ก ํ๋ก์ธ์ฑํ๋ค. ์ด๋ ์ฃผ๋ณ์ ํฝ์
๋ค์ spatial relationship ์ ์ด์ฉํ์ฌ fc layer๋ณด๋ค ๋ ์ ์ ํ๋ผ๋ฏธํฐ๋ฅผ ์ฌ์ฉํ๋ฉฐ, ๋ชจ๋ ์ด๋ฏธ์ง์ ์ํด ์๋ ๊ฐ๊ฐ์ ํฝ์
๋ค์ ๋ํด ๋ค์ ํ์ตํ ํ์๊ฐ ์๋ค. convolutional layers๋ฅผ ์ฃผ๋ก ๊ฐ๋ ๋คํธ์ํฌ๋ฅผ convolutional neural network, CNN
์ด๋ผ๊ณ ํ๋ค.
์์ ์ด๋ฏธ์ง๊ฐ transformation ์ ๋ํด ์์ ์ ์ด๋ผ๋ (์๋ฏธ๊ฐ ๋ณํ์ง ์์) ์ฌ์ค์ ๋ณด์๋ค. ๋ณธ ์น์ ์์ ์ ์์ด๋์ด๋ฅผ ์ํ์ ์ผ๋ก ๋ช ํํ ์ง๊ณ ๋์ด๊ฐ๊ณ ์ ํ๋ค.
์ด๋ฏธ์ง, $\bold{x}$ ์ ํจ์, $\bold{f}[\bold{x}]$๋ transform, $\bold{t}[\bold{x}]$ ์ ๋ํด ๋ค์์ ๋ง์กฑํ๋ฉด invariant
ํ๋ค๊ณ ํ๋ค.
ํ ๋ง๋๋ก ์ ๋ ฅ ์ด๋ฏธ์ง $\bold{x}$ ๋ transformed ๋ ์ด๋ฏธ์ง, $\bold{t}[\bold{x}]$ ๊ฐ (์๋ฅผ ๋ค์ด,) ์ด๋ฏธ์ง ๋ถ๋ฅ์์ ๊ฐ์ ๊ฒฐ๊ณผ๋ฅผ ๋ด์ผํ๋ค๋ ๊ฒ์ด๋ค. (Fig. 10.1.) ((a), b) ๋ โmountainโ ์ผ๋ก ๊ฐ์์ผํจ. )
๋ชจ๋ธ $\bold{f}[\bold{x}]$๋ ์ด๋ค ์ด๋ฏธ์ง๋ฅผ ์์ง์ด๋ (translated), ๋๋ฆฌ๋ (rotated), ๋ค์ง๋ (flipped) ํน์ ์ํ (warpping) ์ ํ๋ ์๋ณธ ์ด๋ฏธ์ง์ ๊ฐ์ objects ๋ฅผ ํฌํจํ ๊ฒ์ผ๋ก ์ธ์ํด์ผํ๋ค.
๋ํ ์๋ ์์ ๋ง์กฑํ๋ฉด ๋ชจ๋ธ, $\bold{f}[\bold{x}]$ ๋ transform, $\bold{t}[\bold{x}]$์ ๋ํ์ฌ equivariant
ํน์ covariant
ํ๋ค๊ณ ํ๋ค.
ํ ๋ง๋๋ก, transform์ ํ ์ด๋ฏธ์ง๋ฅผ ๋ชจ๋ธ์ ๋ฃ์ ๊ฒฐ๊ณผ์ ์๋ณธ ์ด๋ฏธ์ง๋ฅผ ๋ฃ๊ณ transform์ ํ ๊ฒฐ๊ณผ๊ฐ ๊ฐ์์ผํ๋ค๋ ๊ฒ์ด๋ค. Fig. 10.1. ์ ๋ณด๋ฉด c) ๋ ์๋ณธ ์ด๋ฏธ์ง, $\bold{x}$, e) ๋ $\bold{x}$๋ฅผ ์ ๋ ฅ์ผ๋ก ๋ฐ์ segmentation model์ ๊ฒฐ๊ณผ, $\bold{f}[\bold{x}]$, d)๋ transoformed image, $\bold{t}[\bold{x}]$, f) ๋ $\bold{f}[\bold{t}[\bold{x}]]$ ์ด๋ค.
์ ์์์ segmentation model ์ธ $\bold{f}[\bold{x}]$๋ equivariant ํน์ covariant ํ๋ค. Eq. 10.2. ์ ์ข๋ณ์ e) โ f), ์ฐ๋ณ์ d) โ f) ๋ก ๋์ด ๊ฐ๊ธฐ ๋๋ฌธ์ด๋ค.