심화 1팀 - CS231n
Lecture 2: Image Classification
- Semantic gap → pixel value가 조금만 달라지더라도 컴퓨터는 다른 값으로 인식하는 문제
- CIFAR10 데이터셋을 이용하여 수업을 진행
Nearest Neighbors
K-Nearest Neighbors
- L1, L2를 모두 사용
- K가 클수록 경계가 부드러워지는 경향
- 이미지 분류에는 거의 사용되지 않음
- 시간이 너무 오래걸림
- 이미지 수가 많아질수록 필요한 데이터 수가 매우 증가한다는 단점
- Distance metrics가 유사도 측정에 적합하지 않음
Linear Classification
- 이미지를 고차원에 있는 한 점이라고 보고, 각 카테고리를 분류시켜주는 선을 긋는 것
- 선형적 관계를 가지지 않는 데이터의 분류가 어려움
Hyperparameters
- Cross-validation: 작은 dataset에서만 사용
- Train (+Validation) + Test set
Lecture 3: Optimization