고급 비전 모델 — 트랜스포머와 멀티모달 → 분할(Segmentation) & 생성

U-Net 아키텍처

정밀한 생체의학 이미지 분할을 위해 인코더-디코더 구조와 스킵 연결(skip connections)을 가진 U-Net을 구축합니다.

1 / 15

0:00

1:59

🎓 강의 스크립트

유넷은 2015년에 의료 영상 분할을 위해 탄생한 아키텍처예요.

왼쪽 빨간 영역을 보세요. 의료 영상에는 세 가지 큰 도전이 있어요.

이 내용을 보세요. 첫째, 레이블 부족이에요. 전문 의사가 직접 픽셀 단위로 경계를 표시해야 하거든요.

30장의 학습 데이터를 확보하는 것조차 어려운 환경이에요.

둘째, 정밀한 경계가 필요해요. 세포막 한두 픽셀 차이가 진단 결과를 바꿀 수 있어요.

셋째, 클래스 불균형이에요. 배경이 95퍼센트고 병변은 5퍼센트에 불과해요.

가운데 파란 영역을 보시면, 유넷이 이 문제들을 어떻게 해결했는지 나와요.

인코더와 디코더가 대칭인 U자 구조를 사용해요.

스킵 커넥션으로 인코더의 고해상도 특징을 디코더에 직접 전달해요.

일래스틱 디포메이션으로 30장의 데이터를 수백 장처럼 활용해요.

세포 경계에 가중치를 주는 로스 함수로 인접 세포를 분리해요.

오른쪽 초록 영역의 성과를 보세요. 아이에스비아이 2015 대회에서 우승했어요.

겨우 30장으로 아이오유 영점구이영삼을 달성했어요. 2위보다 3퍼센트 높았죠.

2025년 기준 6만 회 이상 인용된, 의료 영상 분할의 사실상 표준이에요.

세포, 장기, 종양 분할은 물론 위성 영상과 자율주행까지 확장되었어요.

소량 데이터와 정밀 경계 분할을 동시에 해결한 게임 체인저랍니다.

다음 슬라이드에서 유넷의 전체 구조를 자세히 살펴볼게요.

인코더가 어떻게 특징을 압축하고, 디코더가 어떻게 복원하는지 보겠습니다.

특히 스킵 커넥션이 왜 결정적으로 중요한지 직관적으로 이해해볼게요.

유넷이 왜 단순한 에프시엔보다 월등한 성능을 보이는지 함께 알아봐요.

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

트랜스포머 시험attention 수식 정리self-attention 원리트랜스포머 과제

비전공/입문자

트랜스포머 쉽게attention 직관트랜스포머란

취준생

트랜스포머 면접attention 구현NLP 엔지니어 준비

직장인

트랜스포머 실무LLM 파인튜닝

대학원생/연구자

attention mechanism 논문efficient transformer 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비