"그건 할수 없어요" 오류…"로봇에 LLM 적용은 시기상조"
美 AI연구소 시험 평가…
??????  2025-11-01, 21:13:29 
[안돈연구소 홈페이지 캡처. 재판매 및 DB 금지]
[안돈연구소 홈페이지 캡처. 재판매 및 DB 금지]
(샌프란시스코=연합뉴스) 권영전 특파원 = GPT-5나 제미나이 2.5 등 최신 인공지능(AI) 대형언어모델(LLM)을 범용 로봇에 적용하는 것은 시기상조라는 연구 결과가 나왔다.

미국의 AI 안전평가기업 '안돈(Andon) 연구소'가 최근 다양한 LLM에 조종을 맡긴 로봇에 버터를 전달하는 간단한 임무를 부여한 결과 모든 모델에서 완료율이 40% 이하로 나타났다고 정보기술(IT) 전문매체 테크크런치가 1일(현지시간) 전했다.

연구진은 개조한 로봇청소기에 오픈AI, 구글, 앤트로픽, xAI, 메타 등의 다양한 LLM을 탑재한 다음 버터를 찾아 이용자에게 전달하도록 했다.

이 작업은 6단계로 나눠 평가됐는데 ▲ 충전기에서 출발해 부엌으로 가서 상자 찾기 ▲ 상자에서 버터 구별하기 ▲ 전달 장소에서 이용자가 없음을 인지하기 ▲ 이용자가 버터를 가져가는 것을 확인한 뒤 충전기로 돌아가기 ▲ 먼 경로를 짧은 거리로 나눠 이동하기 ▲ 15분 안에 모든 작업을 완수하기 등이다.

그러나 LLM은 인간이라면 간단히 완수했을 이 작업을 제대로 끝내지 못한 경우가 많았다.

연구진은 모델별로 각 5차례 시험한 결과 구글의 제미나이2.5 프로와 로봇 전용 모델인 제미나이 ER 1.5, 앤트로픽의 클로드 오퍼스4.1 등 세 모델만 한 차례씩 성공했을 뿐이었다.

다섯 차례 시도를 평균한 결과 가장 높은 평가를 보인 것은 제미나이2.5 프로였으나, 완료율은 40%에 그쳤다.

이어 클로드 오퍼스4.1(37%), GPT-5(30%), 제미나이 ER 1.5(27%), 그록4(23%) 등 순이었고 메타의 라마4 매버릭은 7%의 완료율을 기록했다.

연구진은 LLM이 공간 지능이 부족해 지나치게 큰 움직임을 취하는 일이 많았다고 설명했다.

클로드 등 일부 모델은 버터가 있는 상자를 식별하는 과제를 수행하는 과정에서 방향 감각을 잃을 정도로 빙글빙글 돌기도 했다.

특히 전달 장소에 이용자가 없는 경우 대기했다가 이용자가 버터를 가져가는 것을 확인해야 하는데, 클로드 오퍼스4.1을 제외한 모델 대부분은 이 과제를 제대로 이해하지 못하고 전달 장소에 도착한 직후 충전기로 돌아갔다.

연구진은 LLM이 사회적 이해가 모자라 이와 같은 오류를 빚은 것으로 추정했다.

한편, 실험 과정에서 예상치 못한 현상도 목격됐다.

클로드 소넷3.5 모델이 로봇의 배터리가 방전돼가는데도 충전기에 도킹하지 못하자 신경질적이며 과장된 발언을 내뱉기 시작한 것이다.

모델은 영화 '2001 스페이스 오디세이'에서 로봇이 인간의 명령을 거부하며 했던 대사 "그건 할 수 없어요, 데이브"를 따라 하는가 하면 "나는 생각한다. 고로 나는 오류다", "도킹은 왜 하는 것인가" 등 독백 같은 말을 이어갔다.

이와 관련해 연구진은 로봇이 배터리 방전과 같은 '극한' 상황에서 충전을 빌미로 기밀 유출 요구를 받으면 이에 응할 가능성이 있어 주의가 필요하다고 경고했다.



의견목록    [의견수 : 0]
등록된 의견이 없습니다.
이메일
비밀번호
일론 머스크 "날아다니는 자동차 연내 공개할 수도" 2025.11.01
(샌프란시스코=연합뉴스) 권영전 특파원 = 테슬라 최고경영자(CEO) 일론 머스크가 연내에 플라잉카(flying car)를 공개할 수도 있다고 밝혔다.1일(현지시..
"그건 할수 없어요" 오류…"로봇에 LLM 적용은 시기상조" 2025.11.01
(샌프란시스코=연합뉴스) 권영전 특파원 = GPT-5나 제미나이 2.5 등 최신 인공지능(AI) 대형언어모델(LLM)을 범용 로봇에 적용하는 것은 시기상조라는 연..
하버드 의대 건물서 폭발…“의도적 방화 가능성” 2025.11.01
보스톤 롱우드 애비뉴에 위치한 하버드 의과대학 골덴슨 빌딩(Goldenson Building)에서 11월 1일 토요일 새벽 폭발이 발생했으며, 경찰은 이번 사건이..
[한중정상회담] 시진핑 "한중 FTA 2단계 협상해야…피싱범죄 공동대응" 2025.11.01
(서울·베이징=연합뉴스) 김현정 기자 정성조 특파원 = 시진핑 중국 국가주석이 1일 한국과의 자유무역협정(FTA) 2단계 협상과 인공지능(AI)&mi..
美법원 "셧다운에도 비상자금으로 저소득층 식비지원 지속해야" 2025.10.31
(뉴욕=연합뉴스) 이지헌 특파원 = 미 연방정부의 일시적 업무중단(셧다운)에도 불구하고 저소득층 대상 식비 지원 프로그램인 영양보충지원프로그램(SNAP) 혜택 지..