이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 딥러닝(Deep Learning) — 인공 신경망의 세계 → 생성 모델 — 데이터를 만들어내는 AI → VAE & GAN
재매개화 기법(reparameterization trick)과 ELBO 손실을 사용하여 VAE를 구현합니다.
오늘 다룰 주제는 브이에이이, 변분 오토인코더예요.
우리가 지금까지 배운 씨엔엔이나 레스넷 같은 모델은 판별 모델이에요.
그림 왼쪽 빨간 박스를 보세요.
판별 모델은 입력 이미지가 고양이인지 강아지인지 분류하죠.
수학적으로 피 오브 와이 기븐 엑스, 조건부 확률을 학습하는 거예요.
하지만 이건 경계면만 아는 거예요. 데이터가 어떻게 생겼는지는 전혀 몰라요.
이제 오른쪽 파란 박스를 보세요.
생성 모델은 완전히 다른 질문을 해요. 데이터 분포 자체를 학습해요.
피 오브 엑스를 학습하면 그 분포에서 새로운 샘플을 뽑아낼 수 있어요.
잠재 벡터 제트에서 시작해서 디코더를 통과하면 새 이미지가 만들어지죠.
아래쪽 비교 테이블을 보면 차이가 명확해요.
판별 모델은 경계면만, 생성 모델은 분포 전체를 모델링해요.
왜 분포를 알아야 할까요? 분포를 알면 없던 데이터를 만들 수 있으니까요.
대표적 생성 모델이 브이에이이, 갠, 디퓨전 모델이에요.
가운데 파란 강조 박스를 보세요.
브이에이이는 확률적 레이턴트 변수로 피 오브 엑스를 학습하는 모델이에요.
이 한 줄이 오늘 레슨의 핵심이에요.
그러면 오토인코더에서 출발해서 브이에이이가 왜 필요한지 보겠습니다.
이 여정을 따라가면 확률적 생성의 본질을 이해할 수 있을 거예요.
먼저 오토인코더의 구조부터 살펴볼게요.
선생님: 판별 모델과 생성 모델의 근본적 차이가 뭘까요?
선생님: 각각 어떤 확률 분포를 학습하는지 생각해보세요.
학생: 판별 모델은 피 오브 와이 기븐 엑스를 학습하고, 생성 모델은 피 오브 엑스를 학습해요.
선생님: 맞아요. 그래서 생성 모델만 새 데이터를 만들 수 있는 거죠.
학생: 분류만 하면 데이터가 어떻게 생겼는지 모르니까 새로 만들 수 없는 거군요.
선생님: 정확해요. 브이에이이는 이 피 오브 엑스를 잠재 변수를 통해 학습하는 똑똑한 방법이에요.