메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

네이버클라우드, 하이퍼클로바X 테크니컬 리포트 공개

하이퍼클로바X 로고

4일 네이버클라우드가 초대규모 AI(인공지능) '하이퍼클로바X(HyperCLOVA X)'의 테크니컬 리포트를 공개했다. 테크니컬 리포트는 AI 모델의 세부 정보를 소개하는 논문이다.

 

리포트에 따르면 하이퍼클로바X는 성능 평가에서 글로벌 오픈소스 및 폐쇄형 모델들과 경쟁에서 우수한 성적을 기록했다.

 

글로벌 오픈소스 모델보다 높은 종합 점수를 획득했다. 한국어는 물론 일반상식, 수학, 코딩 부문에서 비교 평가를 위해 선정한 14개 모델 중 1위를 기록했다. 폐쇄형모델과의 비교에서도 하이퍼클로바X는 우수한 점수를 획득했다.

 

특히 다국어 능력에서 압도적인 수준을 보였다. 학습 데이터의 대부분을 차지하는 한국어와 영어 정보를 활용해 제3의 언어로 추론하는 능력을 갖췄다. 일본어, 아랍어, 힌디어, 베트남어를 비롯한 아시아 국가 언어 능력을 평가했을 때, 하이퍼클로바X는 주요 오픈소스 모델을 포함해 리포트에서 선정한 9개 모델 중 가장 높은 점수를 획득했으며, 중국어에서만 같은 모델들 중 2위를 기록했다.

 

리포트에 따르면 하이퍼클로바X의 사전학습 데이터는 대부분 한국어, 영어, 코드 데이터로 구성된다. 학습 데이터 수준을 높이기 위해 매우 짧거나 반복적인 저품질 문서는 데이터셋에서 제외하고 개인정보가 포함된 데이터도 삭제했다. 또한 정렬학습을 통해 사용자의 의도와 지시를 AI가 더 잘 이해할 수 있도록 모델을 고도화했다. 또 사회적 이슈와 편향, 불법적 행동 등 민감하거나 위험한 주제를 설정해 질의 데이터를 수집하고, 이를 기반으로 레드티밍(Red-teaming:기술 또는 서비스의 취약점을 발견하고 검증하기 위해 의도적으로 공격을 시도하는 활동)을 수행해 모델의 취약점을 보완했다.

 

성낙호 네이버클라우드 하이퍼스케일(Hyperscale) AI 기술 총괄은 "테크니컬 리포트를 통해 하이퍼클로바X의 성능 경쟁력이 다시 한 번 입증됐다"며 "한국 특화 지식뿐만 아니라 프로그래밍과 수학적 추론, 다국어 능력과 안전성까지 확보한 소버린 AI의 '모범 사례'로서, 하이퍼클로바X 구축 경험을 활용해 향후 다양한 지역 및 국가의 특화 초대규모 AI를 만드는 데에도 적극적으로 나설 것"이라고 말했다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr