심화1팀
GAN
$$
\argmax_D
$$
VAEs vs. GAN
- GAN의 경우는 Discriminator를 속이기 위해
- VAE의 경우 $\mu$와 $\sigma$로 explicit하게 모델링을 진행
Reinforcement Learning
Reward
$$
R_t = \sum_{i=t}^\infty \gamma^i r_t
$$
DQN/Policy Gradient
$$
\mathcal L = -\log P(a_t | s_t) R_t
$$
- Log-likelihood of action $\log P(a_t|s_t)$
- Reward $R_t$ → "일종의 가중치"로 해석할 수 있음
자연어기초팀
PyTorch Rhythm
Data Definition 단계
- 자연어처리는 text 데이터를 다루며, 이를 정의하는 단계가 중요함
- 숫자가 아닌 text를 숫자로 치환하는 것
- 길이가 서로 다른 단어 및 문장들을 다루는 것
Text Representation
Bag of Words (BoW)
희소행렬(sparse matrix)로 나타내짐