이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 컴퓨터 비전(Computer Vision) — 기계에게 눈을 주다 → 딥러닝을 활용한 비전 — 검출에서 세그멘테이션까지 → 이미지 분류
PyTorch를 사용하여 이미지 분류를 위한 합성곱 신경망(Convolutional Neural Network)을 구축하고 훈련합니다.
CNN 이미지 분류기가 뭔지 알아봅시다.
사진 한 장을 넣으면 클래스를 예측해요.
예를 들어 고양이, 강아지, 자동차를 구분해요.
그림 위쪽을 보세요.
입력 이미지가 왼쪽에 있어요.
이 이미지가 여러 단계를 거쳐 분류돼요.
먼저 특징 추출 단계가 있어요.
Conv 레이어가 엣지와 패턴을 자동으로 찾아요.
사람이 특징을 설계할 필요가 없어요.
가운데 부분을 보면 풀링이 나와요.
풀링은 크기를 줄이면서 핵심만 남겨요.
그 다음이 분류 단계예요.
FC 레이어가 최종 판단을 내려요.
Softmax가 확률로 변환해줘요.
오른쪽 출력을 보세요.
고양이 92%, 강아지 5% 이런 식이에요.
왜 씨엔엔이 이미지 분류에 강할까요?
공간 구조를 자연스럽게 활용하기 때문이에요.
픽셀 간의 관계를 파악하는 거예요.
2012년 알렉스넷이 이미지넷 대회에서 우승했어요.
그때부터 씨엔엔이 비전의 표준이 됐어요.
지금도 의료 영상, 자율주행에 핵심이에요.
먼저 전체 구조를 잡고 세부로 들어갑시다.
선생님: 자, 씨엔엔에서 Conv 레이어의 역할이 뭔가요?
학생: Conv 레이어는 이미지에서 특징을 자동으로 추출해요. 엣지, 텍스처, 패턴 같은 걸 필터로 감지하는 거예요.
선생님: 맞아요! 그럼 왜 사람이 직접 특징을 설계하는 것보다 나은 건가요?
학생: 사람이 놓칠 수 있는 패턴까지 데이터에서 자동으로 학습하니까요. 수백만 장의 이미지에서 최적의 필터를 찾아내는 거예요.
선생님: 정확해요! 이게 딥러닝 혁명의 핵심이에요.