생성 모델 — 데이터를 만들어내는 AI → VAE & GAN

변분 오토인코더(VAE)

재매개화 기법(reparameterization trick)과 ELBO 손실을 사용하여 VAE를 구현합니다.

1 / 19

생성 모델의 핵심 동기: 분류를 넘어 창조로 왜 생성 모델이 필요한가? 실무에서 이 개념 없이는 문제를 해결할 수 없습니다. 핵심 동기와 배경을 먼저 이해합시다. 분류 모델(CNN, ResNet 등)은 판별(Discriminative) 모델입니다. "이 이미지가 고양이인가 개인가?"를 판단하죠. 하지만 생성(Generative) 모델은 다릅니다: - "고양이 이미지를 새로 만들어라" - "이 문장의 다음 단어를 생성하라" - "이 스타일로 새로운 음악을 작곡하라" 판별 vs 생성의 수학적 차이: - 판별: P(y|x) — 입력 x가 주어졌을 때 레이블 y의 확률 - 생성: P(x) — 데이터 x 자체의 확률 분포를 학습 P(x)를 알면 새로운 x를 샘플링 할 수 있습니다. VAE, GAN, Diffusion 모델 모두 이 P(x)를 근사하는 방법입니다. 생성 모델의 응용: - 이미지 생성 (DALL-E, Stable Diffusion) - 텍스트 생성 (GPT) - 데이터 증강 (학습 데이터 부족 시) - 이상 탐지 (P(x)가 낮은 데이터 = 이상) 왜 중요한가? - 판별 모델 P(y|x)는 라벨 예측만 가능, 데이터 분포 P(x) 자체를 이해하지 못함 - 생성 모델은 P(x)를 학습하여 새 데이터 생성, 이상 탐지, 데이터 증강, 결측치 대체 가 가능 - 베이즈 정리로 P(y|x) = P(x|y)P(y)/P(x) \to 생성 모델은 판별도 가능한 상위 개념

0:00

1:30

🎓 강의 스크립트

오늘 다룰 주제는 브이에이이, 변분 오토인코더예요.

우리가 지금까지 배운 씨엔엔이나 레스넷 같은 모델은 판별 모델이에요.

그림 왼쪽 빨간 박스를 보세요.

판별 모델은 입력 이미지가 고양이인지 강아지인지 분류하죠.

수학적으로 피 오브 와이 기븐 엑스, 조건부 확률을 학습하는 거예요.

하지만 이건 경계면만 아는 거예요. 데이터가 어떻게 생겼는지는 전혀 몰라요.

이제 오른쪽 파란 박스를 보세요.

생성 모델은 완전히 다른 질문을 해요. 데이터 분포 자체를 학습해요.

피 오브 엑스를 학습하면 그 분포에서 새로운 샘플을 뽑아낼 수 있어요.

잠재 벡터 제트에서 시작해서 디코더를 통과하면 새 이미지가 만들어지죠.

아래쪽 비교 테이블을 보면 차이가 명확해요.

판별 모델은 경계면만, 생성 모델은 분포 전체를 모델링해요.

왜 분포를 알아야 할까요? 분포를 알면 없던 데이터를 만들 수 있으니까요.

대표적 생성 모델이 브이에이이, 갠, 디퓨전 모델이에요.

가운데 파란 강조 박스를 보세요.

브이에이이는 확률적 레이턴트 변수로 피 오브 엑스를 학습하는 모델이에요.

이 한 줄이 오늘 레슨의 핵심이에요.

그러면 오토인코더에서 출발해서 브이에이이가 왜 필요한지 보겠습니다.

이 여정을 따라가면 확률적 생성의 본질을 이해할 수 있을 거예요.

먼저 오토인코더의 구조부터 살펴볼게요.

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

딥러닝 기말고사딥러닝 중간고사인공지능 전공 정리딥러닝 과제신경망 시험 대비

비전공/입문자

딥러닝 쉽게 설명딥러닝이란AI 기초 공부딥러닝 독학딥러닝 입문 추천

취준생

딥러닝 면접 질문AI 엔지니어 준비딥러닝 포트폴리오

직장인

딥러닝 실무 적용AI 업스킬링직장인 딥러닝 강의

대학원생/연구자

딥러닝 최신 동향neural network 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비