230307 ์ธ์
Computer Science/Engineering > Artificial Inteligence > Machine Learning > Deep Learning > Transformer
Machine Learning
- Supervised Learning : labeled datasets ์ฌ์ฉ
- Classification : ๋ถ๋ฅ, ํน์ ํด๋์ค๋ฅผ ์์ธก
- Regression : ์ค์นผ๋ผ ๊ฐ(์์น)์ ์์ธก.
- Unsupervised Learning : unlabeled data ์ฌ์ฉ
- Clustering : ๋น์ทํ ํน์ฑ์ ๊ฐ์ง ๊ทธ๋ฃน์ผ๋ก ๋๋
- Reinforcement Learning : reward๋ฅผ ์ต๋ํํ๋ ๋ฐฉํฅ์ผ๋ก ํ์ต ์งํ
- Exploration : Agent๊ฐ ์๋ก์ด ํ๋ ์ํ, ๋ ๋ง์ ์ ๋ณด ์ป์
- Exploitation : ์ด๋ฏธ ์๋ ค์ง ์ ๋ณด ๋ฐํ์ผ๋ก ์ต๋ reward๋ฅผ ์ป๊ธฐ ์ํ action
Alexnet
- 2012๋ ImageNet ๋ํ์์ ์ฐ์นํ ์ฌ์ธต ํฉ์ฑ๊ณฑ ์ ๊ฒฝ๋ง(CNN) ๊ตฌ์กฐ.
- GPU๋ฅผ ์ฌ์ฉํ ํจ์จ์ ์ธ ํ์ต.
- ์ปดํจํฐ ๋น์ ๋ถ์ผ์์ ๋ฅ๋ฌ๋์ ์ค์์ฑ์ ๋์ค์๊ฒ ์๋ฆฌ๋ ๋ฐ ํฐ ์ญํ
AlphaGo
1920 CPUs, 280 GPUs ๊ฐ ์ฌ์ฉ๋ ๊ฒ์ผ๋ก ์๋ ค์ง
Generative AI
- Generative adversarial neural network (GAN) : Generator ์ Discriminator๊ฐ ์๋ก ๊ฒฝ์ํ๋ฉด์ ํจ๊ป ํ์ตํ๋ ๋ชจ๋ธ. Generator๋ ์ง์ง์ ๊ตฌ๋ถ์ด ์ ๋ ์ ๋์ ๊ฐ์ง ์ด๋ฏธ์ง ์์ฑํ๋ ค๊ณ ์๋, Discriminator๋ ์ด๋ฏธ์ง๊ฐ ์ง์ง์ธ์ง ๊ฐ์ง์ธ์ง ํ๋ณํ๋ ค๊ณ ํจ. -> Generator๊ฐ ์ง์ง์ ์ ์ฌํ ์ด๋ฏธ์ง๋ฅผ ๋ ์์ฑํ ์ ์๊ฒ ๋์์ค
- Diffusion Model : ๋ฌด์์ ๋ฐ์ดํฐ(๋ ธ์ด์ฆ)์์ ์์ํ์ฌ ์ ์ฐจ ๋ชฉํ ๋ฐ์ดํฐ ๋ถํฌ๋ก ํ๋ฅ ๋ถํฌ๋ฅผ ์กฐ์ .
- Large Language Model (LLM) : ๋๊ท๋ชจ์ ํ ์คํธ ๋ฐ์ดํฐ๋ฅผ ํ์ตํ์ฌ ์ธ๊ฐ๊ณผ ๊ฐ์ ํ ์คํธ๋ฅผ ์ดํดํ๊ณ ์์ฑํ๋ ์ธ๊ณต์ง๋ฅ ๋ชจ๋ธ.
Transformer Model
์์ฐจ์ ์ผ๋ก ์ ๋ณด๋ฅผ ์ฒ๋ฆฌํ์ง ์๊ณ ์ ์ฒด ์ํ์ค๋ฅผ ํ ๋ฒ์ ์ฒ๋ฆฌํ ์ ์๋ attention ๊ธฐ๋ฐ์ ์ํคํ ์ฒ.
attention -> ์ด๋์ ์ง์คํ ์ง
ํธ๋์คํฌ๋จธ ๋ชจ๋ธ์ ๋ฑ์ฅ์ผ๋ก, AI ์ฐ๊ตฌ์ ์์ฉ์ด ํฌ๊ฒ ๋ฐ์ .
Cloude 3
LLaMA - ์คํ์์ค๋ก ๊ณต๊ฐ
Generative agent
GPT ์ธ์ด ๋ชจ๋ธ๋ก ์ฌํํ ์คํ, ์ธ์ด ๋ชจ๋ธ๋ก ๊ฐ ์บ๋ฆญํฐ์๊ฒ ์ญํ ์๋ ค์ค.
์์์ NPC๋ค๋ผ๋ฆฌ ์ํธ์์ฉํ๋ ๊ฒ ํ์ธ.
Transformer์ Mamba : ๋ฅ๋ฌ๋ ์ํคํ ์ฒ
Transformer | Mamba | |
๋งค์ปค๋์ฆ | Attention ๋งค์ปค๋์ฆ : ์ ๋ ฅ ์ํ์ค์ ๊ฐ ์์๊ฐ ์๋ก ์ํธ์์ฉ -> ๋ฌธ๋งฅ ์ดํด์ ํจ๊ณผ์ |
Structured State Space Models, S4 : ๊ธด ์ํ์ค ๋ฐ์ดํฐ๋ฅผ ํจ์จ์ ์ผ๋ก ์ฒ๋ฆฌ |
๊ณ์ฐ ํจ์จ์ฑ๊ณผ ํ์ฅ์ฑ | - ๋ณต์กํ ์์ฐ์ด ์ดํด ์์
์์ ๋์ ์ฑ๋ฅ - ์ํ์ค ๊ธธ์ด๊ฐ ๊ธธ์ด์ง์๋ก ๊ณ์ฐ ๋น์ฉ๊ณผ ๋ฉ๋ชจ๋ฆฌ ์๊ตฌ๋ ํฌ๊ฒ ์ฆ๊ฐ |
- ํ๋์จ์ด ์ธ์ ์๊ณ ๋ฆฌ์ฆ (ํ๋์จ์ด ํน์ฑ๊ณผ ํ๊ณ๋ฅผ ๊ณ ๋ คํ์ฌ ๋ชจ๋ธ์ ์ฑ๋ฅ๊ณผ ํจ์จ ์ต์ ํ) -> ๊ณ์ฐ ํจ์จ์ฑ ๊ทน๋ํ - ๊ธด ์ํ์ค ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋์ ์ฑ๋ฅ ์ ์ง |
์ ์ฉ ๋ถ์ผ | ์์ฐ์ด ์ฒ๋ฆฌ(NLP) : ๊ธฐ๊ณ ๋ฒ์ญ, ํ ์คํธ ์์ฝ, ์ง๋ฌธ ๋ต๋ณ ์์คํ |
๊ธด ์ํ์ค ๋ฐ์ดํฐ ์ฒ๋ฆฌ ๋ถ์ผ : ์ค๋์ค ์ฒ๋ฆฌ, ์ ์ ์ฒดํ, ์๊ณ์ด ๋ถ์ ๋ฑ |
+ GPT
https://www.gttkorea.com/news/articleView.html?idxno=4086
์ธ๊ณต์ง๋ฅ์ ํ๋ จ์ ํตํด ๊ฐ์ค์น(weight)๋ผ ๋ถ๋ฅด๋ ๋งค๊ฐ๋ณ์๋ฅผ ๋ฐฐ์ฐ๊ฒ ๋๋ค.
๊ฐ์ค์น๋ ์ ๋ ฅ๋ ๊ฐ์ด ์ธ๊ณต์ง๋ฅ์ ํ๋จ์ ์ํฅ์ ์ฃผ๋ ์ ๋์ด๋ค.
1750์ต๊ฐ์ ์ค์๋(parameter)๋ก ๋ณด๋ค ์ ๊ตํ ์์
์ ํ๋ จํ๋ ์ฑGPT๋ ๋ณด๋ค ์ ๊ตํ๊ณ , ํจ์จ์ ์ธ ํ๊ฐ์ ๋ณด์ ์์คํ
์ด ํ์ํ๋ค. ์ฑGPT๋ ์ง๋ํ์ต(Supervised Learning) ๊ณผ ๊ฐํํ์ต(Reinforcement Learning)๋ผ๋ 2๋ฒ์ ํ์ต ๊ณผ์ ์ ๊ฑฐ์น๋ค.
์ถ์ฒ : ์งํฐํฐ์ฝ๋ฆฌ์(https://www.gttkorea.com)
ํ๊ณ ์ถ์ ๋ถ์ผ์ ๋ฐ๋ฅธ ํนํ๋ ๋ฐฉ๋ฒ๋ค์ด ์๋ค.
ํฌ๊ฒ๋ Computer Vision / Speech / NLP / ๋ฑ๋ฑ.
์ต์ SOTA(state of the art) ๋ชจ๋ธ ์ฐพ์๋ณด๋ฉด ์ข๋ค.