로지스틱 회귀 — 확률로 분류하기

로지스틱 회귀를 사용한 이진 분류를 학습하고 교차 검증으로 평가합니다.

1 / 15

로지스틱 회귀란? — 분류를 위한 회귀, 시그모이드 함수

로지스틱 회귀(Logistic Regression)는 이름에 "회귀"가 들어가지만, 실제로는 분류(Classification)를 위한 모델입니다.

핵심 아이디어:

- 선형 회귀의 출력 z = w^T x + b를 시그모이드 함수에 통과시켜 0~1 사이 확률로 변환

- 시그모이드 함수: $\sigma(z) = \frac{1}{1 + e^{-z}}$

- 출력값 \hat{y} = \sigma(z) \geq 0.5이면 클래스 1, 아니면 클래스 0

왜 선형 회귀를 그대로 쓰면 안 될까?

- 선형 회귀의 출력은 (-\infty, +\infty) → 확률로 해석 불가

- 이상치 하나에 결정 경계가 크게 흔들림

- 시그모이드를 쓰면 출력이 항상 (0, 1) 사이 → 확률로 해석 가능!

직관적 예시: 이메일 스팸 분류

| 특성 | 스팸 확률 |

|---|---|

| "무료", "당첨" 단어 多 | 0.95 (스팸) |

| 일반 업무 메일 | 0.12 (정상) |

| "할인", "지금 바로" 포함 | 0.78 (스팸) |

→ 시그모이드가 선형 결합을 확률로 매핑해주는 핵심 장치!

로지스틱 회귀의 장점:

- 결과가 확률이라 해석이 쉬움

- 계산이 빠르고 대규모 데이터에도 효율적

- 많은 실무 분류 문제의 기본 베이스라인

왜 중요한가? 로지스틱 회귀의 결정 경계는 w^Tx + b = 0인 초평면입니다. 이 경계에서 확률은 정확히 0.5이고, 한쪽은 양성, 반대쪽은 음성으로 분류됩니다. 선형 결정 경계의 장점은 차원에 관계없이 시각적으로 이해할 수 있고, 어떤 피처가 결정에 기여하는지 직관적으로 파악된다는 점입니다. 하지만 XOR 같은 비선형 패턴은 포착할 수 없으며, 이것이 커널 기법이나 신경망이 필요한 이유이기도 합니다.

0:00

2:18

🎓 강의 스크립트

로지스틱 회귀는 이름에 회귀가 들어가지만, 사실 분류를 위한 모델이에요.

왼쪽 그림을 보세요. 선형 회귀로 합격 여부를 예측하면 어떻게 될까요?

직선이 데이터를 관통하면서 위로는 1을 넘고, 아래로는 0 미만이 돼요.

확률이라면 반드시 영과 일 사이여야 하는데, 선형 회귀는 이걸 보장하지 못해요.

게다가 이상치 하나가 들어오면 직선 전체가 기울어져서 결정 경계가 크게 흔들려요.

이제 오른쪽을 보세요. 시그모이드 함수를 통과시키면 S자 곡선이 나타나요.

시그모이드 함수는 어떤 값이든 영과 일 사이로 눌러주는 함수예요.

수식으로 보면, 시그마 z는 1 나누기 1 더하기 e의 마이너스 z승이에요.

z가 매우 크면 시그마는 1에 가까워지고, z가 매우 작으면 0에 가까워져요.

그리고 z가 정확히 0일 때 시그마 값은 0.5예요. 이 지점이 바로 결정 경계에요.

파란 점선을 보면 z 등호 0인 지점에서 클래스가 나뉘는 걸 확인할 수 있어요.

출력이 0.5 이상이면 클래스 1, 미만이면 클래스 0으로 분류하는 거예요.

왜 회귀라는 이름이 붙었냐면, 확률값 자체가 영에서 일 사이의 연속값이기 때문이에요.

최종 분류는 이 확률에 임계값을 적용해서 결정하는 2단계 구조예요.

Cox가 1958년에 제안한 이 모델은 지금도 의료와 금융 분야에서 널리 쓰여요.

딥러닝의 뉴런 하나가 바로 이 로지스틱 회귀와 동일한 구조라는 점도 기억하세요.

즉, 로지스틱 회귀를 이해하면 신경망의 기본 단위를 이해하는 거예요.

실무에서는 새로운 모델의 성능을 비교할 때 항상 로지스틱 회귀를 기준선으로 먼저 돌려봐요.

계산이 빠르고 해석이 쉬워서 기본 베이스라인으로 최적이거든요.

면접에서도 단골 질문이에요. 로지스틱 회귀가 왜 회귀인지, 시그모이드가 왜 필요한지 설명할 수 있어야 해요.

오른쪽 하단의 수식 박스를 다시 보세요. z 등호 w 트랜스포즈 x 더하기 b, 이게 선형 결합이에요.

이 선형 결합을 시그모이드에 넣어서 확률로 바꾸는 게 로지스틱 회귀의 전부예요.

💬 강의 Q&A

0:00

0:46

🎓 강의 스크립트

선생님: 로지스틱 회귀가 왜 회귀라는 이름이 붙었는지 아는 사람?

학생: 이름에 회귀가 있으니까 연속값을 예측하는 건가요?

선생님: 좋은 추측이에요! 확률값 자체는 영과 일 사이의 연속값이에요. 하지만 최종 목적은 분류죠.

학생: 아, 그러면 확률을 먼저 구하고 임계값으로 분류하는 2단계인 거네요?

선생님: 정확해요! 시그모이드로 확률을 구하고, 임계값 0.5를 기준으로 클래스를 결정해요.

학생: 그런데 왜 하필 시그모이드 함수를 쓰나요? 다른 함수도 있잖아요.

선생님: 시그모이드는 미분이 깔끔하고, 로그 오즈와 직접 연결되거든요. 수학적으로 가장 자연스러운 선택이에요.

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

머신러닝 기말고사회귀분석 정리분류 알고리즘 비교머신러닝 과제

비전공/입문자

머신러닝이란머신러닝 입문머신러닝 독학 로드맵AI 기초

취준생

머신러닝 면접 질문데이터 사이언티스트 준비ML 엔지니어 포트폴리오

직장인

머신러닝 실무 적용업무 자동화 ML비전공자 머신러닝

대학원생/연구자

ML 알고리즘 비교 논문classical ML 서베이

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비

로지스틱 회귀 — 확률로 분류하기

로지스틱 회귀를 사용한 이진 분류를 학습하고 교차 검증으로 평가합니다.

1 / 15

로지스틱 회귀란? — 분류를 위한 회귀, 시그모이드 함수

로지스틱 회귀(Logistic Regression)는 이름에 "회귀"가 들어가지만, 실제로는 분류(Classification)를 위한 모델입니다.

핵심 아이디어:

- 선형 회귀의 출력 z = w^T x + b를 시그모이드 함수에 통과시켜 0~1 사이 확률로 변환

- 시그모이드 함수: $\sigma(z) = \frac{1}{1 + e^{-z}}$

- 출력값 \hat{y} = \sigma(z) \geq 0.5이면 클래스 1, 아니면 클래스 0

왜 선형 회귀를 그대로 쓰면 안 될까?

- 선형 회귀의 출력은 (-\infty, +\infty) → 확률로 해석 불가

- 이상치 하나에 결정 경계가 크게 흔들림

- 시그모이드를 쓰면 출력이 항상 (0, 1) 사이 → 확률로 해석 가능!

직관적 예시: 이메일 스팸 분류

| 특성 | 스팸 확률 |

|---|---|

| "무료", "당첨" 단어 多 | 0.95 (스팸) |

| 일반 업무 메일 | 0.12 (정상) |

| "할인", "지금 바로" 포함 | 0.78 (스팸) |

→ 시그모이드가 선형 결합을 확률로 매핑해주는 핵심 장치!

로지스틱 회귀의 장점:

- 결과가 확률이라 해석이 쉬움

- 계산이 빠르고 대규모 데이터에도 효율적

- 많은 실무 분류 문제의 기본 베이스라인

0:00

2:18

🎓 강의 스크립트

로지스틱 회귀는 이름에 회귀가 들어가지만, 사실 분류를 위한 모델이에요.

왼쪽 그림을 보세요. 선형 회귀로 합격 여부를 예측하면 어떻게 될까요?

직선이 데이터를 관통하면서 위로는 1을 넘고, 아래로는 0 미만이 돼요.

확률이라면 반드시 영과 일 사이여야 하는데, 선형 회귀는 이걸 보장하지 못해요.

게다가 이상치 하나가 들어오면 직선 전체가 기울어져서 결정 경계가 크게 흔들려요.

이제 오른쪽을 보세요. 시그모이드 함수를 통과시키면 S자 곡선이 나타나요.

시그모이드 함수는 어떤 값이든 영과 일 사이로 눌러주는 함수예요.

수식으로 보면, 시그마 z는 1 나누기 1 더하기 e의 마이너스 z승이에요.

z가 매우 크면 시그마는 1에 가까워지고, z가 매우 작으면 0에 가까워져요.

그리고 z가 정확히 0일 때 시그마 값은 0.5예요. 이 지점이 바로 결정 경계에요.

파란 점선을 보면 z 등호 0인 지점에서 클래스가 나뉘는 걸 확인할 수 있어요.

출력이 0.5 이상이면 클래스 1, 미만이면 클래스 0으로 분류하는 거예요.

왜 회귀라는 이름이 붙었냐면, 확률값 자체가 영에서 일 사이의 연속값이기 때문이에요.

최종 분류는 이 확률에 임계값을 적용해서 결정하는 2단계 구조예요.

Cox가 1958년에 제안한 이 모델은 지금도 의료와 금융 분야에서 널리 쓰여요.

딥러닝의 뉴런 하나가 바로 이 로지스틱 회귀와 동일한 구조라는 점도 기억하세요.

즉, 로지스틱 회귀를 이해하면 신경망의 기본 단위를 이해하는 거예요.

실무에서는 새로운 모델의 성능을 비교할 때 항상 로지스틱 회귀를 기준선으로 먼저 돌려봐요.

계산이 빠르고 해석이 쉬워서 기본 베이스라인으로 최적이거든요.

면접에서도 단골 질문이에요. 로지스틱 회귀가 왜 회귀인지, 시그모이드가 왜 필요한지 설명할 수 있어야 해요.

오른쪽 하단의 수식 박스를 다시 보세요. z 등호 w 트랜스포즈 x 더하기 b, 이게 선형 결합이에요.

이 선형 결합을 시그모이드에 넣어서 확률로 바꾸는 게 로지스틱 회귀의 전부예요.

💬 강의 Q&A

0:00

0:46

🎓 강의 스크립트

선생님: 로지스틱 회귀가 왜 회귀라는 이름이 붙었는지 아는 사람?

학생: 이름에 회귀가 있으니까 연속값을 예측하는 건가요?

선생님: 좋은 추측이에요! 확률값 자체는 영과 일 사이의 연속값이에요. 하지만 최종 목적은 분류죠.

학생: 아, 그러면 확률을 먼저 구하고 임계값으로 분류하는 2단계인 거네요?

선생님: 정확해요! 시그모이드로 확률을 구하고, 임계값 0.5를 기준으로 클래스를 결정해요.

학생: 그런데 왜 하필 시그모이드 함수를 쓰나요? 다른 함수도 있잖아요.

선생님: 시그모이드는 미분이 깔끔하고, 로그 오즈와 직접 연결되거든요. 수학적으로 가장 자연스러운 선택이에요.