울산과학기술원(UNIST)이 딥러닝 AI 모델의 컴파일 과정에서 오토튜닝 시간을 대폭 단축하는 혁신 기술을 개발했다고 12일 밝혔다.
이슬기 교수 연구팀이 개발한 이 기법은 기존 대비 최대 2.5배 빠른 오토튜닝이 가능하며 컴퓨터 시스템 분야 최고 권위 학회인 OSDI에 논문이 채택되는 성과를 거뒀다. 한국인이 주저자로 참여한 연구가 OSDI에 채택된 것은 학회 20여 년 역사상 12건에 불과해 그 의미가 크다.
AI 모델을 실제 구동하려면 고수준 프로그램을 GPU나 CPU 같은 연산 장치가 처리할 수 있는 형태로 변환하는 컴파일 작업이 필수다. '고양이 사진을 구분해줘'와 같은 간단한 명령도 수천 줄의 복잡한 계산 코드로 변환돼야 한다.
이 과정에서 오토튜닝은 수십만 개에 달하는 코드 조합 가운데 연산 장치에서 최적의 성능을 발휘하는 구성을 자동으로 선별하는 핵심 기술이다. 그러나 튜닝 시간이 수십 분에서 수 시간까지 소요되고 전력 소모량도 많다는 한계가 지적돼왔다.
연구팀은 딥러닝 모델 내부에 반복 계산 구조가 빈번하게 나타난다는 특성을 활용했다. 비슷한 연산자들이 정보를 상호 공유하도록 해 탐색 영역을 축소하는 방식으로 문제를 해결했다. 매번 새로운 코드 조합을 찾는 대신 기존 결과를 재활용함으로써 오토튜닝 효율성을 극대화한 것이다.
이 방식을 기존 오토튜닝 프레임워크인 Ansor에 적용한 결과, 동일한 성능의 실행 코드 생성 시간이 CPU에서 평균 2.5배, GPU에서 평균 2배 단축됐다.
이슬기 교수는 "컴파일 시간 단축과 함께 GPU나 CPU의 직접적인 실험 횟수가 줄어들어 제한된 연산 자원을 효율적으로 활용할 수 있고 전력 소모도 줄일 수 있다"고 설명했다.
이번 연구는 정이수 연구원이 제1저자로 참여했으며 과학 기술정보통신부 정보통신기획평가원의 지원으로 수행됐다.
OSDI는 SOSP와 함께 컴퓨터 시스템 분야를 대표하는 양대 학회로 평가받는다. 구글의 텐서플로 같은 AI 기술도 이 학회를 통해 세상에 공개된 바 있다.
올해 학회에는 총 338편의 논문이 제출됐으나 이 가운데 48편만 채택됐으며 국내에서는 이슬기 교수팀과 이재욱 서울대학교 교수팀 연구가 함께 선정됐다. 학회는 지난달 7일부터 3일간 미국 보스턴에서 개최됐다.
Copyright ⓒ Metro. All rights reserved. (주)메트로미디어의 모든 기사 또는 컨텐츠에 대한 무단 전재ㆍ복사ㆍ배포를 금합니다.
주식회사 메트로미디어 · 서울특별시 종로구 자하문로17길 18 ㅣ Tel : 02. 721. 9800 / Fax : 02. 730. 2882
문의메일 : webmaster@metroseoul.co.kr ㅣ 대표이사 · 발행인 · 편집인 : 이장규 ㅣ 신문사업 등록번호 : 서울, 가00206
인터넷신문 등록번호 : 서울, 아02546 ㅣ 등록일 : 2013년 3월 20일 ㅣ 제호 : 메트로신문
사업자등록번호 : 242-88-00131 ISSN : 2635-9219 ㅣ 청소년 보호책임자 및 고충처리인 : 안대성