생성 모델 — 데이터를 만들어내는 AI → 확산 모델(Diffusion Models)

노이즈 제거 확산 모델(DDPM)

순방향 및 역방향 확산 과정과 노이즈 스케줄링(noise scheduling)을 이해합니다.

1 / 17

Forward Process: 이미지에 노이즈를 점진적으로 추가

What — Forward Process란?Forward Process(전방 과정)는 원본 이미지 $x_0$에 가우시안 노이즈를 $T$번 점진적으로 더해, 최종적으로 순수 노이즈 $x_T \sim \mathcal{N}(0, I)$로 만드는 과정각 스텝 $t$에서의 변환은 마르코프 체인(Markov Chain)으로, 오직 직전 상태 $x_{t-1}$에만 의존한다 (Ho et al., 2020)학습이 필요 없는 고정된 과정이며, 역방향(Reverse Process)을 학습시키기 위한 '정답지' 역할을 한다Why — 왜 노이즈를 점진적으로 추가하는가?한 번에 노이즈를 추가하면, 모델이 역으로 복원할 수 있는 단서가 전혀 남지 않음아주 작은 노이즈를 여러 번 더하면, 각 스텝의 변화가 미세 → 역방향에서 "한 스텝 전 상태"를 추정하기 쉬워짐비유: 깨끗한 칠판 위에 분필 가루를 한 줌씩 뿌리는 것. 첫 몇 번은 글씨가 보이고, 수십 번 뿌리면 완전히 가려짐How — 한 스텝의 수학적 정의노이즈 스케줄 $\beta_t$ (보통 $\beta_1 = 10^{-4}$, $\beta_T = 0.02$로 선형 증가)한 스텝 전이 분포:q(x_t | x_{t-1}) = \mathcal{N}(x_t;\ \sqrt{1 - \beta_t}\, x_{t-1},\ \beta_t I)$\sqrt{1 - \beta_t}$: 원본 신호를 약간 줄이는 스케일링 계수$\beta_t$: 추가되는 노이즈의 분산 — $t$가 커질수록 노이즈 비중 증가How — 임의 시점으로의 점프 (Closed-Form)$\alpha_t = 1 - \beta_t$, 누적곱 $\bar{\alpha}_t = \prod_{s=1}^{t} \alpha_s$ 로 정의하면$t=0$에서 $t$까지 중간 스텝을 거치지 않고 한 번에 계산 가능:q(x_t | x_0) = \mathcal{N}(x_t;\ \sqrt{\bar{\alpha}_t}\, x_0,\ (1 - \bar{\alpha}_t) I)재매개변수화(Reparameterization): $\epsilon \sim \mathcal{N}(0, I)$를 샘플링하면x_t = \sqrt{\bar{\alpha}_t}\, x_0 + \sqrt{1 - \bar{\alpha}_t}\, \epsilon이 식 덕분에 학습 시 임의의 t를 뽑아 즉시 x_t를 만들 수 있어 효율적 (Sohl-Dickstein et al., 2015)시각화 — Forward Process 진행 다이어그램[여기에 다이어그램]다이어그램 구성:가로축: 시간 스텝 $t = 0, 1, 2, \ldots, T$상단 행: 이미지가 점점 흐려지는 과정을 5단계로 표현t=0: 선명한 고양이 이미지 (원본 x_0)t=250: 윤곽은 보이나 디테일 손실t=500: 형체가 희미하게 남음t=750: 거의 노이즈, 실루엣만 약간t=1000: 순수 가우시안 노이즈 $x_T$각 이미지 사이에 화살표, 화살표 위에 q(x_t | x_{t-1}) 표기하단 그래프: \bar{\alpha}_t 값의 감소 곡선t=0에서 \bar{\alpha}_0 \approx 1 (신호 100%)t=T에서 \bar{\alpha}_T \approx 0 (신호 0%, 노이즈 100%)곡선 아래 영역을 '신호 비율', 위 영역을 '노이즈 비율'로 색 구분우측에 핵심 수식 x_t = \sqrt{\bar{\alpha}_t} x_0 + \sqrt{1-\bar{\alpha}_t} \epsilon 박스신호 대 노이즈 비율 (SNR) 관점$\text{SNR}(t) = \frac{\bar{\alpha}_t}{1 - \bar{\alpha}_t}$t가 작을 때: SNR 높음 → 원본 신호가 지배적t가 클 때: SNR 낮음 → 노이즈가 지배적Kingma et al. (2021)은 노이즈 스케줄을 SNR 관점에서 재정의하여 다양한 스케줄을 통합 비교Latent Diffusion에서의 Forward ProcessStable Diffusion은 픽셀 공간이 아닌 VAE 잠재 공간에서 Forward Process 수행 (Rombach et al., 2022)원본 이미지 → VAE Encoder → 잠재 벡터 z_0 → 여기에 노이즈 추가512×512 이미지가 64×64×4 잠재 공간으로 압축 → 연산량 약 48배 감소Forward Process 수식 자체는 동일: $z_t = \sqrt{\bar{\alpha}_t} z_0 + \sqrt{1-\bar{\alpha}_t} \epsilon$

0:00

1:40

🎓 강의 스크립트

디디피엠의 Forward Process, 즉 확산 과정을 볼게요.

이미지에 노이즈를 점진적으로 추가하는 과정이에요.

그림 왼쪽의 x0를 보세요. 원본 고양이 이미지예요.

여기서 오른쪽으로 갈수록 노이즈가 점점 추가돼요.

x250에서는 약간 노이즈가 있지만 윤곽이 보여요.

x500에서는 형태가 흐릿해지고, 정보가 절반만 남아요.

x750에서는 거의 노이즈만 남아요. 형태가 소실됐어요.

그림 맨 오른쪽 x_T는 순수 가우시안 노이즈예요.

정보가 0퍼센트로, 원본의 흔적이 전혀 없어요.

아래 수식 박스를 보세요. Forward 한 스텝의 수식이에요.

x_t는 이전 x_{t-1}에 가우시안 노이즈를 더한 거예요.

평균을 루트 1 마이너스 베타 t로 축소해요.

그리고 분산 베타 t만큼 노이즈를 추가해요.

왼쪽 하단 박스를 보세요. 마르코프 체인 성질이에요.

x_t는 오직 바로 이전 x_{t-1}에만 의존해요.

그래서 각 스텝이 독립적으로 정의될 수 있어요.

오른쪽 하단은 핵심 인사이트예요.

베타 t가 충분히 작으면 역과정도 가우시안으로 근사할 수 있어요.

이것이 디디피엠 학습의 이론적 근거가 돼요.

0.0001에서 0.02 사이의 아주 작은 값이에요.

한 스텝에서 아주 작은 변화만 일어나기 때문이에요.

이걸 1000번 반복하면 완전한 노이즈가 되는 거예요.

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

딥러닝 기말고사딥러닝 중간고사인공지능 전공 정리딥러닝 과제신경망 시험 대비

비전공/입문자

딥러닝 쉽게 설명딥러닝이란AI 기초 공부딥러닝 독학딥러닝 입문 추천

취준생

딥러닝 면접 질문AI 엔지니어 준비딥러닝 포트폴리오

직장인

딥러닝 실무 적용AI 업스킬링직장인 딥러닝 강의

대학원생/연구자

딥러닝 최신 동향neural network 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비