이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 컴퓨터 비전(Computer Vision) — 기계에게 눈을 주다 → 고전적 컴퓨터 비전 — 픽셀에서 기하학까지 → 이미지 처리 기초
An overview of the Computer Vision field: what it is, why it matters, and what you will learn.
컴퓨터 비전은 기계가 이미지를 이해하는 기술이에요.
사람은 사진을 보면 0.1초 만에 고양이인지 알죠?
하지만 컴퓨터에게 이미지는 숫자 배열일 뿐이에요.
그림 왼쪽을 보세요, 픽셀 그리드가 보이시죠?
각 칸에 0부터 255 사이의 숫자가 들어 있어요.
224곱하기 224 이미지라면 픽셀이 15만 개가 넘어요.
알지비 세 채널이니까 숫자가 총 15만 528개예요.
이 숫자 더미에서 의미를 뽑는 게 컴퓨터 비전의 핵심이에요.
가운데 파이프라인을 보시면 처리 단계가 나와요.
먼저 전처리로 크기를 맞추고 정규화해요.
그다음 특징 추출 단계에서 엣지와 텍스처를 찾아요.
마지막에 씨엔엔이나 트랜스포머로 패턴을 인식해요.
오른쪽을 보면 출력 태스크가 네 가지 있어요.
분류는 이미지 전체에 하나의 라벨을 붙이는 거예요.
검출은 물체의 위치와 크기까지 찾아내요.
세그멘테이션은 픽셀 하나하나에 클래스를 지정해요.
추적은 영상에서 같은 물체를 프레임마다 따라가요.
맨 오른쪽 응용 분야를 보세요.
자율주행부터 의료 영상, 위성 분석까지 정말 다양하죠.
이 과목에서 이 모든 과정을 단계별로 배울 거예요.
하단 요약을 보면 핵심 공식이 나와 있어요.
이미지를 숫자로, 숫자를 의미로 바꾸는 전체 흐름이에요.
선생님: 컴퓨터에게 이미지는 뭐라고 했죠?
학생: 숫자 배열이요, 각 픽셀이 0에서 255 사이의 값이에요.
선생님: 맞아요! 그러면 224곱하기 224 컬러 이미지의 숫자 개수는?
학생: 알지비 세 채널이니까 224 곱하기 224 곱하기 3, 약 15만 개요.
선생님: 정확해요! 이 15만 개 숫자에서 고양이를 찾는 게 컴퓨터 비전이에요.
학생: 사람은 한눈에 아는 걸 컴퓨터는 그렇게 많은 숫자를 분석하는 거군요.