이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 딥러닝(Deep Learning) — 인공 신경망의 세계 → 합성곱 신경망(CNN) — 이미지를 이해하는 네트워크 → CNN 기초
전이학습 기법을 사용하여 사용자 정의 데이터셋에 대해 ResNet을 미세조정합니다.
트랜스퍼 러닝의 핵심 아이디어를 알아보겠습니다.
딥러닝 모델을 처음부터 학습하려면 엄청난 비용이 듭니다.
그림 왼쪽을 보시면 처음부터 학습하는 경우를 확인할 수 있습니다.
이미지넷 분류기 하나를 처음부터 훈련하려면 140만 장의 이미지와 GPU 수십 대가 필요합니다.
비용은 만 달러에서 5만 달러까지 들 수 있습니다.
의료 영상이나 위성 사진 같은 특수 도메인에서는 데이터를 수천 장도 구하기 어렵습니다.
적은 데이터로 큰 모델을 학습하면 심각한 과적합이 발생합니다.
정확도 막대를 보세요, 고작 45퍼센트에 불과합니다.
이제 그림 오른쪽의 트랜스퍼 러닝을 보겠습니다.
이미 대규모 데이터셋으로 학습된 모델의 지식을 새 문제에 재활용하는 것입니다.
마치 영어를 잘하는 사람이 스페인어를 빠르게 배우는 것과 같습니다.
프리트레인드 씨엔엔은 에지, 텍스처, 패턴 같은 범용 특징을 이미 알고 있습니다.
데이터가 500장만 있어도 90퍼센트 정확도를 달성합니다.
비용은 100분의 1로 줄고, 시간은 수일에서 수시간으로 단축됩니다.
이미지넷에서 학습한 레즈넷 50을 의료 영상에 적용하면 놀라운 성능을 얻습니다.
하단의 파란색 핵심 박스를 보세요.
이미지넷 140만 장의 지식을 500장 문제에 재사용하는 것이 핵심입니다.
2025년 현재, 트랜스퍼 러닝은 거의 모든 컴퓨터 비전 프로젝트의 출발점입니다.
이는 산업계의 표준이 되었습니다.
파운데이션 모델의 등장으로 트랜스퍼 러닝의 중요성은 더욱 커지고 있습니다.
이번 레슨에서는 전이 학습의 원리부터 실전 전략까지 완전히 마스터합니다.
선생님: 트랜스퍼 러닝이 왜 필요한가요? 처음부터 학습하면 안 되나요?
학생: 처음부터 학습하려면 대규모 데이터, GPU, 시간이 필요하잖아요. 의료 영상처럼 데이터가 적은 도메인에서는 과적합이 심하게 발생하니까 비효율적입니다.
선생님: 정확합니다. 그럼 트랜스퍼 러닝의 핵심 원리는 무엇일까요?
학생: 대규모 데이터셋에서 학습한 범용 특징, 예를 들어 에지나 텍스처, 패턴을 새 도메인에 재활용하는 것입니다.
선생님: 효과가 얼마나 되는지 그림에서 확인해볼까요?
학생: 비용이 100분의 1로 줄고, 시간은 수일에서 수시간으로 단축되며, 정확도는 45퍼센트에서 90퍼센트로 두 배 가까이 향상됩니다.