이 레슨과 관련된 학습 키워드
인공지능(AI) — 기계가 생각하는 법 → AI 로보틱스 & Embodied AI — 몸을 가진 지능 → AI 로보틱스 & Embodied AI — 물리 세계의 지능 → 학습 기반 로보틱스
Grasping science, non-prehensile manipulation, dexterous hands, 6-DoF grasps, tool use, deformable objects, TAMP, and foundation models for manipulation.
여러분이 커피잔을 집는 데 걸리는 시간은 고작 0.5초입니다.
하지만 그 짧은 순간, 뇌는 엄청난 계산을 수행하고 있어요.
시각으로 잔의 위치와 형태를 파악하고, 손가락 스무 개 이상의 근육에 동시 명령을 보냅니다.
도자기면 단단히, 종이컵이면 살짝 — 이 힘 조절이 무의식적으로 이뤄져요.
화면 왼쪽 파란 상자를 보세요. 인간 손의 자유도는 스물일곱입니다.
촉각 수용체가 한 손에 만 칠천 개나 있어서, 미세한 미끄러짐까지 감지해요.
이제 오른쪽 빨간 상자를 보면, 로봇 그리퍼는 자유도가 고작 둘에서 열여섯입니다.
힘 토크 센서도 여섯 축이 보통이고, 사람 촉각에 비하면 아주 제한적이에요.
가운데 주황색 격차 상자가 보이시죠? 자유도, 촉각, 적응력 모두 큰 차이가 납니다.
자유도가 스물일곱에서 둘로 줄고, 촉각이 만 칠천 개에서 여섯 축으로 줄었어요.
그래서 같은 잡기 동작이라도 로봇에게는 복잡한 알고리즘이 필요합니다.
하단에 네 가지 해결 접근법이 보여요. 분석적 접근, 학습 기반, 하이브리드, 파운데이션 모델이에요.
분석적 접근은 포스 클로저라는 수학 이론으로 접촉 안정성을 증명하는 방법입니다.
학습 기반은 씨엔엔이나 강화학습으로 데이터에서 잡기 전략을 직접 배우는 거예요.
하이브리드는 탬프라 불리는 작업 및 동작 계획과 학습을 결합한 방식이고요.
파운데이션 모델은 알티투, 옥토 같은 대규모 사전학습 모델을 활용합니다.
이번 레슨에서는 이 네 접근을 모두 살펴보며, 로봇이 어떻게 물건을 잡고 놓는지 깊이 이해해볼 거예요.
사람의 직관적 매니퓰레이션을 로봇이 재현하려면 얼마나 어려운 문제인지 느껴보세요.
자, 그럼 첫 번째로 잡기의 과학, 즉 그래스핑 기초부터 시작하겠습니다.
접촉점, 마찰, 안정성이라는 세 기둥이 기다리고 있어요.
선생님: 인간 손의 자유도가 스물일곱인데, 평행 조 그리퍼의 자유도는 둘이에요. 이 격차가 실제 조작에서 어떤 문제를 만들까요?
학생: 자유도가 적으면 물체를 잡을 수 있는 자세가 크게 제한돼요. 인간은 손가락 각도를 다양하게 바꿔가며 불규칙한 형태도 감싸 쥘 수 있지만, 이축 그리퍼는 평행하게 벌리고 닫는 것만 가능해서 물체 형상에 따라 안정적 파지가 불가능한 경우가 많아요.
선생님: 정확해요! 그래서 로봇 매니퓰레이션 연구에서는 부족한 자유도를 보완하기 위해 어떤 전략을 쓸까요?
학생: 크게 두 방향이 있어요. 하나는 잡기 외 동작, 그러니까 밀기나 기울이기 같은 비파지 동작을 활용해서 물체를 유리한 자세로 재배치하는 거고요. 다른 하나는 다지 로봇 핸드처럼 자유도 자체를 늘리는 하드웨어 접근이에요.
선생님: 맞아요. 두 전략 모두 이번 레슨에서 자세히 다루니까 기대해주세요.