울산과학기술원(UNIST)은 인공지능이 미지의 상황에서도 유연하게 대응할 수 있도록 하는 새로운 학습 기법을 선보였다.
한승열 UNIST 인공지능대학원 교수팀은 AI가 경험하지 않은 임무에도 효과적으로 적응할 수 있게 하는 TAVT(Task-Aware Virtual Training) 기법을 개발했다고 19일 밝혔다.
현재 피지컬 AI 로봇의 가장 큰 문제점은 훈련받지 않은 상황에 대한 적응력 부족이다. 사람은 걷기와 달리기를 할 줄 안다면 중간 속도인 '빠르게 걷기'도 자연스럽게 할 수 있지만, 로봇은 그렇지 않다.
걷기와 전력 질주를 완벽하게 학습한 로봇도 적당한 속도로 달리라는 새로운 지시를 받으면 다리 각도나 힘 조절에 실패해 이상한 동작을 보이거나 멈춰버릴 수 있다.
이번에 개발된 기법의 핵심은 AI가 직접 가상의 임무를 생성해 미리 연습하게 하는 것이다. 시스템은 딥러닝 기반의 표현 학습 모듈과 생성 모듈로 구성된다. 표현 학습 모듈이 서로 다른 임무 간 유사도를 정량화해 임무 구조를 파악하고, 생성 모듈이 이를 조합해 새로운 가상 임무를 창조한다.
생성된 가상 임무는 원래 임무 특징을 보존하도록 설계돼 학습하지 않은 상황에 대한 예습 효과를 제공한다.
제1저자인 김정모 연구원은 "기존 강화학습은 하나의 임무에서 최적의 정책을 익히도록 설계돼 새로운 상황에서는 성능이 급격히 떨어진다"며 "다양한 임무를 경험하게 하는 메타 강화학습 기법도 있지만, 훈련 범위를 벗어난 상황에서는 여전히 적응이 쉽지 않다"고 설명했다.
연구진은 치타, 개미, 2족 보행 등 다양한 로봇 시뮬레이션 환경에서 이 기법을 검증했다. 그 결과 훈련하지 않은 임무에 대한 적응력이 크게 향상됐음을 확인했다.
특히 치타 로봇 시뮬레이션 실험에서 주목할 만한 성과가 나타났다. TAVT 기법을 적용한 로봇은 경험해 보지 못한 중간 속도인 1.25㎧, 1.75㎧ 등에서도 목표 속도를 빠르게 파악해 안정적으로 주행을 지속했다. 반면 기존 메타 강화학습 기법을 적용한 로봇은 적응이 느리거나 넘어지는 현상이 빈번했다.
한승열 교수는 "이번 기법은 AI 에이전트의 임무 일반화 성능을 높일 수 있는 방식으로, 피지컬 AI 로봇이나 자율주행차, 드론 등 다양한 상황에서 유연한 대응이 필수적인 분야에 폭넓게 활용될 수 있을 것"이라고 말했다.
이 연구 결과는 세계 3대 인공지능 학회 가운데 하나인 2025 ICML에 채택됐다. 2025 ICML은 지난달 13일부터 19일까지 캐나다 밴쿠버에서 개최됐다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성