딥러닝을 활용한 비전 — 검출에서 세그멘테이션까지 → 객체 탐지

2단계 검출기(Faster R-CNN)

영역 제안 네트워크(Region Proposal Network) 후 분류 및 박스 회귀를 사용하는 Faster R-CNN 아키텍처를 탐구합니다.

1 / 15

객체 검출의 두 가지 접근: 1-Stage vs 2-Stage

왜 객체 검출의 두 가지 접근: 1-Stage vs 2-Stage이 필요한가? 실무에서 이 개념 없이는 문제를 해결할 수 없습니다. 핵심 동기와 배경을 먼저 이해합시다. 객체 검출(Object Detection)은 이미지에서 "어디에" "무엇이" 있는지를 찾는 과제입니다. 1-Stage Detector (단일 단계): - 이미지 전체를 한 번에 보고 바로 박스 + 클래스를 예측합니다 - 대표 모델: YOLO, SSD, RetinaNet - 장점: 빠른 속도 — 실시간 처리에 적합 (30~60+ FPS) - 단점: 작은 물체나 밀집된 물체에서 정확도가 떨어질 수 있음 2-Stage Detector (두 단계): - 1단계: "물체가 있을 것 같은 후보 영역(Region Proposal)"을 먼저 찾습니다 - 2단계: 각 후보 영역을 정밀하게 분류하고 박스를 보정합니다 - 대표 모델: R-CNN, Fast R-CNN, Faster R-CNN - 장점: 높은 정확도 — 특히 작은 물체에 강함 - 단점: 상대적으로 느림 (5~15 FPS) 핵심 트레이드오프: \text{1-Stage: 속도} \uparrow \quad \text{정확도} \downarrow \qquad \text{2-Stage: 속도} \downarrow \quad \text{정확도} \uparrow Faster R-CNN은 2-stage의 대표 주자로, Region Proposal을 신경망(RPN)으로 생성해서 속도와 정확도를 모두 잡았습니다. 왜 중요한가? 1단계 검출기(YOLO, SSD)는 빠르지만 작은 객체나 밀집된 객체에서 정확도가 떨어집니다. 2단계 검출기는 "어디에 물체가 있을까?"(RPN)와 "이것이 무엇인가?"(분류 헤드)를 분리함으로써 각 단계가 자기 역할에 집중할 수 있습니다. 특히 의료 영상에서 작은 종양 검출, 자율주행에서 먼 거리의 보행자 인식 등 정확도가 생명과 직결되는 응용에서 2단계 접근법이 여전히 선호됩니다. 속도보다 정확도가 중요한 상황에서 2단계 검출기가 최적의 선택인 이유입니다. Faster R-CNN은 Ren 등이 제안한 2단계 객체 검출기로, RPN과 Fast R-CNN을 통합했다 (Ren et al., 2015).

0:00

2:05

🎓 강의 스크립트

객체 검출에는 크게 두 가지 방식이 있어요. 왼쪽의 1-stage와 오른쪽의 2-stage예요.

왼쪽을 보세요. 1-stage는 이미지를 한 번에 쭉 보면서 바로 결과를 뱉어요.

대표적으로 YOLO가 있죠. 이미지를 13곱하기13 그리드로 나눠요.

왼쪽 아래 격자를 보시면, 각 셀이 직접 바운딩 박스와 클래스를 예측해요.

속도가 30에서 60 에프피에스까지 나와요. 실시간 처리가 가능하죠.

하지만 작은 물체를 놓치기 쉬워요. 한 번에 다 처리하니 꼼꼼하지 못한 거예요.

이제 오른쪽을 보세요. 2-stage는 두 단계를 거쳐요.

먼저 스테이지 1에서 알피엔이 물체가 있을 만한 후보 영역을 약 300개 제안해요.

오른쪽 아래 박스들을 보시면, 다양한 크기의 후보 영역이 제안된 걸 볼 수 있어요.

그다음 스테이지 2에서 각 후보를 정밀하게 분류하고 위치를 정제해요.

씨오씨오 벤치마크에서 엠에이피가 42에서 50 이상까지 나와요. 정밀도가 높죠.

속도는 5에서 15 에프피에스로 느리지만, 작은 물체도 정확히 잡아내요.

가운데 하단 요약을 보세요. 정밀도가 중요하면 2-stage, 속도가 중요하면 1-stage예요.

의료 영상이나 자율주행 안전 시스템처럼 놓치면 안 되는 상황에선 2-stage가 필수예요.

반면 실시간 영상 감시나 로봇 네비게이션엔 1-stage가 적합하죠.

이번 레슨에서는 2-stage의 대표 모델인 패스터 알씨엔엔을 깊이 파헤칠 거예요.

알씨엔엔에서 패스터 알씨엔엔까지 어떻게 진화했는지, 그 핵심 구조를 하나하나 살펴봅시다.

특히 알피엔이 왜 혁명적인지, 알오아이 얼라인이 왜 필요한지 이해하게 될 거예요.

에프피엔 백본까지 다루면 현대 2-stage 검출기의 전체 그림이 완성됩니다.

자, 그럼 알씨엔엔 계보의 시작부터 출발해 볼까요?

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

딥러닝 기말고사딥러닝 중간고사인공지능 전공 정리딥러닝 과제신경망 시험 대비

비전공/입문자

딥러닝 쉽게 설명딥러닝이란AI 기초 공부딥러닝 독학딥러닝 입문 추천

취준생

딥러닝 면접 질문AI 엔지니어 준비딥러닝 포트폴리오

직장인

딥러닝 실무 적용AI 업스킬링직장인 딥러닝 강의

대학원생/연구자

딥러닝 최신 동향neural network 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비