심화1팀

GAN

$$ \argmax_D $$

VAEs vs. GAN

GAN의 경우는 Discriminator를 속이기 위해
VAE의 경우 $\mu$와 $\sigma$로 explicit하게 모델링을 진행

Reinforcement Learning

Reward

$$ R_t = \sum_{i=t}^\infty \gamma^i r_t $$

DQN/Policy Gradient

$$ \mathcal L = -\log P(a_t | s_t) R_t $$

Log-likelihood of action $\log P(a_t|s_t)$
Reward $R_t$ → "일종의 가중치"로 해석할 수 있음

자연어기초팀

PyTorch Rhythm

Data Definition 단계

자연어처리는 text 데이터를 다루며, 이를 정의하는 단계가 중요함
- 숫자가 아닌 text를 숫자로 치환하는 것
- 길이가 서로 다른 단어 및 문장들을 다루는 것

Text Representation

Bag of Words (BoW)

희소행렬(sparse matrix)로 나타내짐