"그건 할수 없어요" 오류…"로봇에 LLM 적용은 시기상조"
美 AI연구소 시험 평가…
??????  2025-11-01, 21:13:29 
[안돈연구소 홈페이지 캡처. 재판매 및 DB 금지]
[안돈연구소 홈페이지 캡처. 재판매 및 DB 금지]
(샌프란시스코=연합뉴스) 권영전 특파원 = GPT-5나 제미나이 2.5 등 최신 인공지능(AI) 대형언어모델(LLM)을 범용 로봇에 적용하는 것은 시기상조라는 연구 결과가 나왔다.

미국의 AI 안전평가기업 '안돈(Andon) 연구소'가 최근 다양한 LLM에 조종을 맡긴 로봇에 버터를 전달하는 간단한 임무를 부여한 결과 모든 모델에서 완료율이 40% 이하로 나타났다고 정보기술(IT) 전문매체 테크크런치가 1일(현지시간) 전했다.

연구진은 개조한 로봇청소기에 오픈AI, 구글, 앤트로픽, xAI, 메타 등의 다양한 LLM을 탑재한 다음 버터를 찾아 이용자에게 전달하도록 했다.

이 작업은 6단계로 나눠 평가됐는데 ▲ 충전기에서 출발해 부엌으로 가서 상자 찾기 ▲ 상자에서 버터 구별하기 ▲ 전달 장소에서 이용자가 없음을 인지하기 ▲ 이용자가 버터를 가져가는 것을 확인한 뒤 충전기로 돌아가기 ▲ 먼 경로를 짧은 거리로 나눠 이동하기 ▲ 15분 안에 모든 작업을 완수하기 등이다.

그러나 LLM은 인간이라면 간단히 완수했을 이 작업을 제대로 끝내지 못한 경우가 많았다.

연구진은 모델별로 각 5차례 시험한 결과 구글의 제미나이2.5 프로와 로봇 전용 모델인 제미나이 ER 1.5, 앤트로픽의 클로드 오퍼스4.1 등 세 모델만 한 차례씩 성공했을 뿐이었다.

다섯 차례 시도를 평균한 결과 가장 높은 평가를 보인 것은 제미나이2.5 프로였으나, 완료율은 40%에 그쳤다.

이어 클로드 오퍼스4.1(37%), GPT-5(30%), 제미나이 ER 1.5(27%), 그록4(23%) 등 순이었고 메타의 라마4 매버릭은 7%의 완료율을 기록했다.

연구진은 LLM이 공간 지능이 부족해 지나치게 큰 움직임을 취하는 일이 많았다고 설명했다.

클로드 등 일부 모델은 버터가 있는 상자를 식별하는 과제를 수행하는 과정에서 방향 감각을 잃을 정도로 빙글빙글 돌기도 했다.

특히 전달 장소에 이용자가 없는 경우 대기했다가 이용자가 버터를 가져가는 것을 확인해야 하는데, 클로드 오퍼스4.1을 제외한 모델 대부분은 이 과제를 제대로 이해하지 못하고 전달 장소에 도착한 직후 충전기로 돌아갔다.

연구진은 LLM이 사회적 이해가 모자라 이와 같은 오류를 빚은 것으로 추정했다.

한편, 실험 과정에서 예상치 못한 현상도 목격됐다.

클로드 소넷3.5 모델이 로봇의 배터리가 방전돼가는데도 충전기에 도킹하지 못하자 신경질적이며 과장된 발언을 내뱉기 시작한 것이다.

모델은 영화 '2001 스페이스 오디세이'에서 로봇이 인간의 명령을 거부하며 했던 대사 "그건 할 수 없어요, 데이브"를 따라 하는가 하면 "나는 생각한다. 고로 나는 오류다", "도킹은 왜 하는 것인가" 등 독백 같은 말을 이어갔다.

이와 관련해 연구진은 로봇이 배터리 방전과 같은 '극한' 상황에서 충전을 빌미로 기밀 유출 요구를 받으면 이에 응할 가능성이 있어 주의가 필요하다고 경고했다.



의견목록    [의견수 : 0]
등록된 의견이 없습니다.
이메일
비밀번호
도깨비 방망이처럼…트럼프 관세 무기화 확대에 세계 속수무책 2025.11.02
도널드 트럼프 미국 대통령이 특별한 사안에 제한적으로 쓰는 통상 도구인 관세의 목적과 활용도를 점점 확대하자 세계 교역 상대의 고심이 더욱 깊어지고 있다.관세를..
"그건 할수 없어요" 오류…"로봇에 LLM 적용은 시기상조" 2025.11.01
(샌프란시스코=연합뉴스) 권영전 특파원 = GPT-5나 제미나이 2.5 등 최신 인공지능(AI) 대형언어모델(LLM)을 범용 로봇에 적용하는 것은 시기상조라는 연..
[한중정상회담] 시진핑 "한중 FTA 2단계 협상해야…피싱범죄 공동대응" 2025.11.01
(서울·베이징=연합뉴스) 김현정 기자 정성조 특파원 = 시진핑 중국 국가주석이 1일 한국과의 자유무역협정(FTA) 2단계 협상과 인공지능(AI)&mi..
비트코인 '업토버' 끝났다…7년만에 첫 '10월 월간 하락' 2025.10.31
(샌프란시스코=연합뉴스) 권영전 특파원 = 매년 10월마다 이어졌던 비트코인의 상승 행진이 7년 만에 멈췄다.31일(현지시간) 미국 가상화폐 거래소 코인베이스에..
구글·아마존 이익 급증 뒤엔 앤스로픽…MS는 오픈AI 손실 반영 2025.10.31
(샌프란시스코=연합뉴스) 권영전 특파원 = 시장 전망치를 뛰어넘는 3분기 실적을 보인 구글 모회사 알파벳과 아마존의 이익 급증엔 인공지능(AI) 챗봇 '클..