이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → 자연어처리(NLP) — 기계가 언어를 이해하다 → NLP 응용 — 번역, 요약, 질의응답 → 실전 응용
NLP 분야의 2024-2026 핵심 트렌드를 살펴봅니다.
2017년 트랜스포머({Transformer→트랜스포머})가 발표된 이후, 엔엘피({NLP→엔엘피})의 지형이 완전히 바뀌었어요.
타임라인 상단을 보시면, 2017년부터 2025년까지의 핵심 이정표가 순서대로 나열되어 있어요.
버트({BERT→버트})와 지피티({GPT→지피티})가 등장하면서 사전 학습의 시대가 열렸어요.
2020년 지피티-3는 1750억 개 파라미터로, 인컨텍스트 러닝이라는 새 능력을 보여줬어요.
2022년 ChatGPT는 단 두 달 만에 1억 사용자를 확보한 역사적 사건이었어요.
알엘에이치에프({RLHF→알엘에이치에프})로 정렬된 이 모델이 에이아이({AI→에이아이})를 대중화시켰죠.
2023년 지피티-4는 텍스트와 이미지를 동시에 이해하는 멀티모달({multimodal→멀티모달}) 시대를 열었어요.
그림 가운데 아래를 보시면, 7대 핵심 트렌드가 색상별로 정리되어 있어요.
스케일링, 멀티모달, 리즈닝({reasoning→리즈닝}), 에이전트, 얼라인먼트({alignment→얼라인먼트}), 효율화, 오픈소스예요.
하단의 주황색 강조 박스를 보세요.
이머전트({emergent→이머전트}) 능력이란 모델이 특정 규모를 넘으면 갑자기 나타나는 현상이에요.
퓨샷 추론, 코드 생성, 체인오브쏘트({chain-of-thought→체인오브쏘트}) 같은 능력이 대표적이죠.
파라미터 규모 성장 막대를 보시면, 6500만에서 1조 8천억까지 기하급수적으로 커졌어요.
2024년부터는 엠오이({MoE→엠오이}) 구조로 효율과 성능을 동시에 추구하고 있어요.
이번 레슨에서 이 모든 트렌드의 핵심을 하나씩 깊이 파헤칠 거예요.
빠르게 변하는 분야인 만큼, 큰 흐름을 잡는 것이 가장 중요해요.
각 트렌드가 왜 등장했고, 서로 어떻게 연결되는지 함께 살펴봐요.
오픈소스와 상용 모델의 경쟁이 발전을 가속화하고 있어요.
코딩, 수학, 과학 추론까지 — 엔엘피의 범위가 놀랍게 확장되고 있어요.
지금이 엔엘피 역사상 가장 흥미진진한 시기라고 해도 과언이 아니에요.
선생님: 엔엘피가 최근 몇 년간 어떻게 변화했는지 타임라인을 보면서 이야기해볼까요?
학생: 2017년 트랜스포머부터 시작해서 불과 7년 만에 에이전트까지 발전했네요.
선생님: 맞아요. 특히 주목할 점은 이머전트 능력이에요. 왜 중요할까요?
학생: 모델을 키우면 예상치 못한 새로운 능력이 갑자기 나타나니까요.
선생님: 정확해요. 그래서 스케일링 법칙 연구가 핵심이 된 거예요.
학생: 그런데 계속 모델만 키우는 건 비용 문제가 있지 않나요?
선생님: 좋은 질문이에요. 그래서 엠오이 같은 효율화 기술이 등장한 거랍니다.