메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

엔비디아, AWS에 엔비디아 NIM 제공 확대

엔비디아 본사/엔비디아

엔비디아가 아마존 웹 서비스(AWS) AI 서비스 전반에 NIM 마이크로서비스를 확장한다고 발표했다. 생성형 AI 모델의 효율적 확장과 비용 절감을 위해 안전한 고성능 추론 솔루션 수요가 증가하고 있다.

 

AWS는 6일(현지시간) 리인벤트 콘퍼런스에서 주요 AWS AI 서비스에 NIM 마이크로서비스를 확대한다고 밝혔다. 이를 통해 생성형 AI 애플리케이션의 추론 속도가 빨라지고 지연 시간이 줄어든다.

 

NIM 마이크로서비스는 AWS 마켓플레이스, 아마존 베드록, 세이지메이커 점프스타트에서 제공된다. 개발자들은 이를 통해 엔비디아 최적화 추론 모델을 쉽게 배포할 수 있다. NIM은 엔비디아 AI 엔터프라이즈 플랫폼에 포함되며, 트리톤 추론 서버, 텐서RT, 파이토치 등을 기반으로 한다. 오픈소스 모델과 엔비디아 파운데이션 모델, 맞춤형 모델을 지원한다.

 

NIM은 EC2, EKS, 세이지메이커를 통해 배포할 수 있으며, AWS의 엔비디아 가속 컴퓨팅 인스턴스에 최적화됐다. AWS에서 사용 가능한 NIM 모델은 ▲네모트론-4 ▲라마 3.1 8B/70B ▲믹스트랄 8x7B 등이다.

 

소프트서브는 AWS에서 NIM 기반 AI 솔루션 6종을 개발해 마켓플레이스에서 제공 중이며, 이를 통해 AI 애플리케이션 개발과 배포 속도가 개선되고 비용이 절감된다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr