네비게이션과 탐색 — 스스로 길 찾기

이런 분들이 찾고 있어요

이 레슨과 관련된 학습 키워드

CS/AI 전공 대학생

로봇 AI 정리로봇 모방학습robot manipulation 과제

비전공/입문자

Embodied AI란로봇 AI 입문

취준생

로봇 AI 취업robotics 포트폴리오

직장인

로봇 자동화산업용 로봇 AI

대학원생/연구자

VLA 모델 논문robot foundation modelsim-to-real

AI 교육 플랫폼

AI 교육 플랫폼 추천AI 강의 사이트머신러닝 온라인 강의딥러닝 강의 추천

AI 독학/로드맵

AI 독학 방법머신러닝 공부 순서딥러닝 로드맵머신러닝 독학 로드맵

AI 취업/커리어

AI 취업 준비데이터 사이언티스트 강의ML 엔지니어 준비AI 면접 준비

네비게이션과 탐색 — 스스로 길 찾기

Learn classical navigation, SLAM, visual/semantic/object-goal navigation, obstacle avoidance, social navigation, exploration, and LLM-guided navigation.

1 / 16

왜 로봇 네비게이션이 어려운가?

왜 왜 로봇 네비게이션이 어려운가?이(가) 필요한가? 실무에서 이 개념 없이는 문제를 해결할 수 없습니다. 핵심 동기와 배경을 먼저 이해합시다.

</div>

2004년, DARPA는 모하비 사막 240km를 자율주행하는 그랜드 챌린지를 개최했습니다. 15대의 로봇 중 완주한 차량은 단 한 대도 없었습니다. 가장 멀리 간 차량이 11.78km — 전체 경로의 5%에 불과했습니다. 이듬해 2005년, 스탠퍼드의 Stanley가 마침내 완주에 성공했습니다. 이 도전이 보여주는 것은 자율 내비게이션(autonomous navigation)이 로봇공학에서 얼마나 근본적이고 어려운 문제인지입니다.

내비게이션은 단순히 "A에서 B로 가라"가 아닙니다. 로봇은 자신이 어디에 있는지 알아야 하고(localization), 주변 환경이 어떻게 생겼는지 파악해야 하며(mapping), 장애물을 피하면서 효율적인 경로를 찾아야 하고(path planning), 예상치 못한 변화에 실시간으로 대응해야 합니다(reactive control). 이 네 가지가 동시에, 끊임없이 작동해야 합니다.

전통적 내비게이션은 모듈형 파이프라인입니다. SLAM으로 지도를 만들고, 전역 플래너가 경로를 계획하고, 지역 플래너가 장애물을 회피하고, 모터 컨트롤러가 실행합니다. 각 모듈은 독립적으로 잘 이해되지만, 모듈 간 오류 전파가 문제입니다. SLAM의 작은 오차가 플래너의 큰 실수로 이어질 수 있습니다. 반면 학습 기반 내비게이션은 센서 입력에서 행동 출력까지를 하나의 신경망으로 매핑합니다. 이번 레슨에서는 두 접근의 장단점, 그리고 이 둘을 결합하는 최신 하이브리드 방법을 체계적으로 탐구합니다.

0:00

2:03

🎓 강의 스크립트

여러분, 오늘 주제는 "왜 로봇 네비게이션이 어려운가"입니다.

화면 왼쪽을 보세요. 인간이 무의식으로 처리하는 다섯 가지 능력이 있어요.

시각 인식, 공간 추론, 의사결정, 사회적 규범, 기억과 학습입니다.

우리는 카페에 들어가면 자연스럽게 빈 자리를 찾고, 사람을 피해 걸어가죠.

이 모든 것이 뇌에서 동시에, 무의식적으로 일어납니다.

이제 오른쪽 로봇 영역을 보세요.

로봇은 이 모든 것을 센서 데이터에서 명시적으로 계산해야 합니다.

인지, 위치추정, 지도 구축이 첫 번째 줄에 있어요.

라이다는 초당 30만 포인트를 쏘고, 카메라는 초당 30프레임을 보내요.

이 데이터를 실시간으로 처리해서 "나는 어디에 있고, 주변에 뭐가 있나"를 알아내야 합니다.

두 번째 줄의 플래닝을 보세요.

글로벌 플래너가 에이스타, 알알티로 전체 경로를 잡고, 로컬 플래너인 디더블유에이가 실시간 장애물을 피합니다.

정적 장애물인 벽과 가구는 코스트맵으로 처리하고, 동적 장애물인 사람과 동물은 예측이 필요해요.

하단 타임라인을 보시면, 2004년 다르파 챌린지에서 15대 중 완주 차량이 제로였어요.

2005년 스탠리가 처음 240킬로미터를 완주했고, 이후 시뮬레이터 기반 연구가 폭발적으로 성장했습니다.

2016년 포인트골 네비게이션, 2020년 해비탯 2.0 소셜 네비게이션이 등장했어요.

2023년 브이엘에프엠, 2024년 나빌라가 비전-언어 모델과 네비게이션을 결합했습니다.

결론적으로, 인간의 무의식적 능력을 로봇에게 구현하는 것이 네비게이션 연구의 본질입니다.

센서 데이터에서 인지, 계획, 실행을 모두 실시간으로 해내야 하는 도전이죠.

다음 블록에서는 이 문제를 해결하기 위한 고전적 접근법부터 살펴보겠습니다.

💬 강의 Q&A

0:00

0:40

🎓 강의 스크립트

선생님: 2004년 다르파 챌린지에서 왜 15대 모두 완주에 실패했을까요?

학생: 사막이라 GPS가 있어도 모래 지형 변화와 장애물 감지가 너무 어려웠을 것 같아요. 센서 처리 속도도 부족했고요.

선생님: 맞아요. 그런데 불과 1년 뒤 스탠리가 성공한 비결은 무엇이었을까요?

학생: 머신러닝으로 도로 표면을 학습하고, 라이다와 카메라를 융합해서 장애물 인식을 개선한 덕분이라고 들었어요.

선생님: 정확해요. 핵심은 단일 센서가 아니라 센서 융합과 학습 기반 인지의 조합이었죠. 이것이 현대 네비게이션의 출발점입니다.