이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → AI 로보틱스 & Embodied AI — 몸을 가진 지능 → AI 로보틱스 & Embodied AI — 물리 세계의 지능 → 기초
AI에게 왜 몸이 필요한지, 역사, 인지-행동 루프, 핵심 능력, 벤치마크, 하드웨어, 산업 응용, AGI까지
ChatGPT에게 "커피 한 잔 타줘"라고 말해보세요.
아무 일도 일어나지 않습니다. 아무리 똑똑한 AI라도 팔이 없으면 컵을 잡을 수 없어요.
이게 디지털 AI의 근본적 한계입니다.
물의 온도를 모르고, 컵의 무게를 느끼지 못하고, 기울어지는 순간을 감지하지 못하죠.
우리가 커피를 따를 때 손의 힘 조절, 눈으로 보는 수위, 온도를 느끼는 촉감이 동시에 작동하잖아요.
화면 왼쪽 빨간 박스를 보세요. Digital AI의 능력 표가 있어요.
텍스트 생성과 이미지 분석은 초록 체크예요. ChatGPT, GPT-4V가 잘 하죠.
그런데 아래를 보면 물리 행동과 환경 감지에 빨간 X가 있어요.
입력이 텍스트와 이미지뿐이고, 출력도 텍스트와 이미지뿐이니까요.
이제 오른쪽 파란 박스를 보세요. Embodied AI는 완전히 달라요.
센서 인지에서 카메라와 LiDAR로 세상을 감지하고, 신경망으로 판단합니다.
물리 행동은 모터를 구동해서 실제로 움직이고, 힘과 촉각 피드백도 받아요.
온도를 감지하고, 무게를 측정하고, 기울기를 보정할 수 있습니다.
가운데 보라색 화살표에 "+몸체"라고 적혀있죠. 몸이 있느냐 없느냐가 핵심 차이예요.
아래 파란 강조 상자를 보세요. 감각 더하기 행동이 물리 세계의 지능이라고 정리했어요.
자율주행차가 핸들을 돌리려면 도로를 봐야 하고, 핸들을 잡아야 하고, 돌려야 해요.
수술 로봇이 메스를 쥐려면 환부를 보고, 힘을 조절하고, 정밀하게 절개해야 해요.
이 모든 과정에서 감각과 행동이 끊임없이 순환합니다.
감각과 행동이 없으면 물리 세계의 지식은 영원히 불완전합니다.
그래서 등장한 것이 Embodied AI예요. 이제 정확한 정의부터 살펴봅시다.
선생님: Digital AI와 Embodied AI의 근본적 차이를 한 마디로 설명해볼까요?
학생: Digital AI는 텍스트와 이미지만 처리하지만, Embodied AI는 센서로 물리 세계를 감지하고 모터로 직접 행동해요.
선생님: 좋아요! 그럼 왜 감각과 행동이 동시에 필요할까요? 하나만 있으면 안 될까요?
학생: 물의 온도를 감지만 하고 컵을 못 잡으면 소용없고, 행동만 하고 온도를 모르면 화상을 입을 수 있으니까요. 둘의 순환이 필수예요.
선생님: 정확해요! 감각과 행동의 순환이 Embodied AI의 핵심이에요.