시각과 언어를 동시 처리하는 로봇의 뇌 지금까지의 인공지능은 텍스트 요약이나 이미지 생성 등 디지털 세계에 머물렀다. 반면 피지컬 AI는 로봇이라는 물리적 형태를 통해 현실 세계의 테스크(작업)를 수행한다. 그 핵심에는 '로보틱스 파운데이션 모델(RFM)'이 있다. 과...
지금까지의 인공지능은 텍스트 요약이나 이미지 생성 등 디지털 세계에 머물렀다. 반면 피지컬 AI는 로봇이라는 물리적 형태를 통해 현실 세계의 테스크(작업)를 수행한다. 그 핵심에는 '로보틱스 파운데이션 모델(RFM)'이 있다. 과거에는 문서를 분류, 요약, 번역하는 모델이 제각각 필요했지만, 이제는 거대한 범용 모델 하나가 여러 작업을 동시에 처리하는 원리다.이를 구동하는 대표적인 방식이 비전 랭귀지 액션(VLA) 모델이다. 로봇이 카메라(눈)를 통해 시각 정보를 받아들이면, AI가 컵의 위치를 파악하고 사람의 음성 명령(언어)을 해석해 관절의 각도까지 계산해 움직인다. VLA가 즉각적인 반응에 유리하다면, 최근 연구되는 '월드 모델(World Model)'은 행동 전 머릿속으로 시뮬레이션을 거쳐 더 복잡하고 새로운 상황에 대처하는 능력을 높이는 데 집중하고 있다
피지컬 AI의 궁극적인 목표는 환경이 변해도 흔들림 없이 임무를 수행하는 일반화 능력(Generalization)이다. 기존 공장의 로봇 암(Arm)은 컨베이어 벨트 위의 고정된 부품만 다뤘다. 하지만 스스로 생각하는 AI 로봇은 물건의 위치나 색상이 바뀌어도 유연하게 대처할 수 있도록 진화하고 있다. 이러한 기술은 당장 한국 사회가 직면한 저출산 및 노동력 부족 문제와 직결된다. 단기적으로는 사람을 완전히 대체하기보다 무거운 짐을 옮기거나 위험한 공정에서 업무를 보조하는 형태로 도입될 것이다. 조선업이나 극한의 산업 현장 등 노동력 수급이 어려운 분야에서 피지컬 AI의 쓰임새는 더욱 커질 것으로 관측된다.
현재 미국과 중국 등 빅테크 기업들이 관련 기술을 선도하고 있다. 당장 이들의 오픈소스 기술을 가져다 쓰면 빠르고 편할 수 있다. 하지만 전문가들은 피지컬 AI만큼은 자체적인 '소버린 AI(Sovereign AI)' 주권을 확보해야 한다고 지적한다. 특정 국가나 기업이 어느 순간 기술 제공을 중단할 경우, 국내 제조업 기반 전체가 흔들릴 수 있기 때문이다. 특히 보안 문제는 더 심각하다. 피지컬 AI는 물리적 세계에서 카메라와 센서를 통해 방대한 데이터를 수집한다. 공장의 핵심 기밀이나 사람들의 생활 공간 데이터가 외부 플랫폼으로 넘어가는 것은 큰 리스크다. 결국 막대한 초기 비용이 들더라도 대한민국 제조업의 특성을 반영한 자체 모델 개발이 장기적인 산업 경쟁력을 좌우할 수밖에 없다.
AI 모델의 고도화는 결국 양질의 데이터 확보 싸움이다. 국내 기업들이 보유한 제조 공장과 가전 인프라는 피지컬 AI를 실증하고 학습시킬 수 있는 훌륭한 테스트베드가 될 수 있다. 글로벌 시장조사업체 옴디아에 따르면 글로벌 휴머노이드 로봇 출하량은 2027년까지 연평균 100% 이상 폭발적으로 성장할 전망이다. 이 골든타임을 놓치지 않기 위해선 연구 단계의 기술을 산업 현장에 빠르게 적용하고 자체 데이터를 축적하는 산학연의 유기적 결합이 시급하다.