그리드 서치와 베이지안 최적화 — 최적 하이퍼파라미터 찾기

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

머신러닝 기말고사회귀분석 정리분류 알고리즘 비교머신러닝 과제

비전공/입문자

머신러닝이란머신러닝 입문머신러닝 독학 로드맵AI 기초

취준생

머신러닝 면접 질문데이터 사이언티스트 준비ML 엔지니어 포트폴리오

직장인

머신러닝 실무 적용업무 자동화 ML비전공자 머신러닝

대학원생/연구자

ML 알고리즘 비교 논문classical ML 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비

그리드 서치와 베이지안 최적화 — 최적 하이퍼파라미터 찾기

그리드 서치, 랜덤 서치, 베이지안 방법을 사용하여 최적의 하이퍼파라미터를 찾는 체계적인 접근법을 학습합니다.

1 / 15

하이퍼파라미터 튜닝이란? — 모델 성능의 마지막 1%

핵심 구분: 파라미터(W, b)는 학습이 알아내고, 하이퍼파라미터(lr, depth, batch)는 사람이 정합니다. 이 선택이 성능의 10~20%를 결정합니다.

</div>

모델 학습에서 파라미터와 하이퍼파라미터는 근본적으로 다릅니다.

파라미터(Parameter): 모델이 데이터로부터 자동 학습하는 값

- 가중치(W): 입력과 출력 사이의 연결 강도

- 편향(b): 활성화 함수의 이동량

- 역전파(backpropagation)로 매 배치마다 갱신

하이퍼파라미터(Hyperparameter): 사람이 학습 전에 설정하는 값

- 학습률(learning rate): 0.001 vs 0.01 → 수렴 속도와 안정성 결정

- 배치 크기(batch size): 32 vs 256 → 메모리와 일반화 균형

- 트리 깊이(max_depth): 3 vs 10 → 모델 복잡도 조절

- 정규화 강도(regularization): L1/L2 페널티 크기

왜 자동화가 필요한가?

- 하이퍼파라미터 3개 x 후보 10개 = 1,000가지 조합

- 각 조합마다 5-fold 크로스 밸리데이션 = 5,000번 학습

- 수동 시행착오는 비효율적이고 재현 불가능

- 자동 튜닝이 10~20% 성능 향상을 가져옴 (Bergstra et al., 2012)

0:00

2:12

🎓 강의 스크립트

하이퍼파라미터 튜닝이 왜 중요한지부터 알아볼게요.

그림 왼쪽을 보세요. 파라미터는 모델이 학습으로 스스로 알아내는 값이에요.

가중치 W와 편향 b가 대표적이에요. 역전파로 매 배치마다 자동으로 갱신돼요.

오른쪽을 보세요. 하이퍼파라미터는 사람이 학습 전에 미리 정하는 값이에요.

러닝 레이트, 배치 사이즈, 맥스 뎁스 같은 거예요. 이걸 어떻게 정하느냐에 따라 성능이 크게 달라져요.

하단 히트맵을 보세요. 러닝 레이트와 맥스 뎁스 조합에 따른 정확도예요.

러닝 레이트 0.01, 맥스 뎁스 5일 때 0.93으로 가장 높아요. 초록색이 진할수록 성능이 좋은 거예요.

반면 러닝 레이트 0.1이면 0.65까지 떨어져요. 빨간색 영역이죠.

같은 모델인데 하이퍼파라미터만 바꿔도 정확도가 28%포인트나 차이 나요.

오른쪽 바 차트를 보세요. 기본값 0.78에서 그리드 서치로 0.89, 베이지안 옵티마이제이션으로 0.93까지 올라가요.

그래서 자동 튜닝이 필수예요. 수동으로 시행착오를 반복하면 비효율적이고 재현도 안 돼요.

하이퍼파라미터 3개에 후보 10개씩이면 천 가지 조합이에요.

각 조합마다 5폴드 크로스 밸리데이션을 하면 5천 번 학습해야 해요.

이걸 사람이 하나하나 해볼 수는 없죠. 그래서 자동화 방법이 연구된 거예요.

2012년 Bergstra와 Bengio 논문에서 자동 튜닝이 10에서 20퍼센트 성능 향상을 가져온다고 보고했어요.

이번 레슨에서 그리드 서치, 랜덤 서치, 베이지안 옵티마이제이션을 순서대로 배울 거예요.

각 방법의 원리와 장단점, 그리고 실전에서 어떻게 쓰는지 알아볼게요.

먼저 가장 단순한 그리드 서치부터 시작해볼게요.

그리드 서치를 이해하면 왜 더 똑똑한 방법이 필요한지 자연스럽게 느끼게 될 거예요.

자, 그럼 다음 슬라이드로 넘어가볼까요.

💬 강의 Q&A

0:00

0:51

🎓 강의 스크립트

선생님: 자, 여기서 중요한 질문 하나 해볼게요. 러닝 레이트를 너무 크게 설정하면 어떤 일이 벌어질까요?

학생: 음, 경사 하강법에서 스텝이 너무 커져서 최적점을 지나쳐버리지 않을까요? 발산할 수도 있을 것 같아요.

선생님: 정확해요! 최적점 근처에서 왔다 갔다 진동하거나, 심하면 로스가 발산해요. 반대로 너무 작으면 수렴이 너무 느리고 로컬 미니멈에 갇힐 수도 있어요.

학생: 그러면 적절한 값을 찾는 게 정말 중요한 거네요. 그걸 자동으로 해주는 게 하이퍼파라미터 튜닝이고요.

선생님: 맞아요. 사실 실무에서 모델 아키텍처보다 하이퍼파라미터 튜닝이 성능에 더 큰 영향을 주는 경우도 많아요. 그래서 체계적인 탐색 방법이 필수인 거예요.