이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 컴퓨터 비전(Computer Vision) — 기계에게 눈을 주다 → 고급 비전 모델 — 트랜스포머와 멀티모달 → 분할(Segmentation) & 생성
정밀한 생체의학 이미지 분할을 위해 인코더-디코더 구조와 스킵 연결(skip connections)을 가진 U-Net을 구축합니다.
유넷은 2015년에 의료 영상 분할을 위해 탄생한 아키텍처예요.
왼쪽 빨간 영역을 보세요. 의료 영상에는 세 가지 큰 도전이 있어요.
첫째, 레이블 부족이에요. 전문 의사가 직접 픽셀 단위로 경계를 표시해야 하거든요.
30장의 학습 데이터를 확보하는 것조차 어려운 환경이에요.
둘째, 정밀한 경계가 필요해요. 세포막 한두 픽셀 차이가 진단 결과를 바꿀 수 있어요.
셋째, 클래스 불균형이에요. 배경이 95퍼센트고 병변은 5퍼센트에 불과해요.
가운데 파란 영역을 보시면, 유넷이 이 문제들을 어떻게 해결했는지 나와요.
인코더와 디코더가 대칭인 U자 구조를 사용해요.
스킵 커넥션으로 인코더의 고해상도 특징을 디코더에 직접 전달해요.
일래스틱 디포메이션으로 30장의 데이터를 수백 장처럼 활용해요.
세포 경계에 가중치를 주는 로스 함수로 인접 세포를 분리해요.
오른쪽 초록 영역의 성과를 보세요. 아이에스비아이 2015 대회에서 우승했어요.
겨우 30장으로 아이오유 영점구이영삼을 달성했어요. 2위보다 3퍼센트 높았죠.
2025년 기준 6만 회 이상 인용된, 의료 영상 분할의 사실상 표준이에요.
세포, 장기, 종양 분할은 물론 위성 영상과 자율주행까지 확장되었어요.
소량 데이터와 정밀 경계 분할을 동시에 해결한 게임 체인저랍니다.
다음 슬라이드에서 유넷의 전체 구조를 자세히 살펴볼게요.
인코더가 어떻게 특징을 압축하고, 디코더가 어떻게 복원하는지 보겠습니다.
특히 스킵 커넥션이 왜 결정적으로 중요한지 직관적으로 이해해볼게요.
유넷이 왜 단순한 에프시엔보다 월등한 성능을 보이는지 함께 알아봐요.
선생님: 유넷이 왜 하필 U자 모양의 대칭 구조를 선택했을까요?
학생: 인코더에서 압축한 정보를 디코더에서 다시 복원해야 하니까 대칭이 자연스럽지 않을까요?
선생님: 맞아요! 그런데 단순 대칭만으로는 경계가 뭉개져요. 여기서 핵심은 스킵 커넥션이에요.
학생: 스킵 커넥션이 없으면 어떻게 되나요?
선생님: 인코더의 고해상도 경계 정보가 사라져서, 디코더가 대략적인 위치만 복원해요.
학생: 그래서 30장으로도 잘 되는 건 데이터 증강 덕분인 거죠?
선생님: 정확해요. 일래스틱 디포메이션이 세포의 자연스러운 변형을 모방해서 소량 데이터를 극복하게 해줘요.