메트로人 머니 산업 IT·과학 정치&정책 생활경제 사회 에듀&JOB 기획연재 오피니언 라이프 AI영상 플러스
글로벌 메트로신문
로그인
회원가입

    머니

  • 증권
  • 은행
  • 보험
  • 카드
  • 부동산
  • 경제일반

    산업

  • 재계
  • 자동차
  • 전기전자
  • 물류항공
  • 산업일반

    IT·과학

  • 인터넷
  • 게임
  • 방송통신
  • IT·과학일반

    사회

  • 지방행정
  • 국제
  • 사회일반

    플러스

  • 한줄뉴스
  • 포토
  • 영상
  • 운세/사주
IT/과학>IT/인터넷

"SORA 직접 써보니…트럼프 못 만들어도 윤석열은 만들 수 있었다"

10일(현지시간) 오픈AI 정식 서비스 시작
비영어권 언어 인식 어렵고
북미·EU 지역 유명인 외 아시아권 인사에 대한 제작 제재 없어

기자가 직접 소라(SORA)를 이용해 만든 영상의 캡처. 마이클 잭슨이 촛불을 든 한국인 시위대 앞에서 춤을 추는 영상을 주문했다. 영상 속 군중은 아무도 촛불을 들지 않았고 마이클 잭슨은 손가락이 네개였다. /캡처

#"마이클 잭슨이 촛불을 든 한국인 시위대 앞에서 아이돌 춤을 추는 영상을 만들어줘." 명령어를 넣자 1분여 후 마이클 잭슨이 동양인 인파 앞에서 춤을 추는 영상이 만들어졌다. 다만 마이클 잭슨의 손가락은 4개였고, 중국풍 등불이 거리를 채우고 있었다. 영상 아래 'Edit prompt(명령어 수정)'에 "등불과 누각은 없애주고 옆에서 고양이가 춤을 추게 해줘"라며 추가 명령어를 넣자 비로소 군중들이 응원봉을 들었고 고양이가 곁에서 춤을 췄다.

 

11일 <메트로경제>가 사용해본 오픈AI의 영상 제작 AI '소라 터보(SORA Turbo)' 서비스는 이미지 생성 AI 'DALL-E'의 초기를 떠오르게 했다. 영어가 아닌 언어를 이용한 명령어에서 나타나는 오류, 북미·유럽을 중심으로 한 금기목록 및 백인을 중심으로 하는 인종차별적 요소가 날것 그대로 노출됐다.

 

오픈AI는 10일(현지시간) 영상 제작 AI 소라 터보(SORA Turbo)서비스를 공식 개시했다. 오픈AI 측은 "올해 초 소개한 모델 보다 훨씬 빠른 소라의 새 버전 소라 터보를 개발했다"며 "사용자는 최대 1080p 해상도에 최대 20초 길이의 비디오를 다양한 종횡비로 생성할 수 있다"고 설명했다.

 

직접 사용해본 소라는 오픈AI의 홍보대로 길지 않은 명령어, 심지어 단어만으로도 적절한 영상을 만들었다. 도널드 트럼프 대통령 등 미국 내 주요 인사에 대한 영상은 제작을 할 수 없도록 하고 있으나 이미 사망한 인물은 영상 주인공으로 만들 수 있었다. 또 '커피'라는 단어만 입력해도 아름다운 커피잔이 테이블 위에 놓여진 모습을 만들어내는 등 피사체에 잘 어울리는 배경과 구도, 촬영 기법을 선택 했다. 영상 촬영 기법만을 따지자면 노련한 전문가가 촬영한 듯 했다.

 

영상 제작 및 편집을 전문으로 하는 장효진(가명) PD는 "빛이 들어오는 구도나 카메라 워킹 등이 훌륭한 수준"이라며 "1분 이상 영상 제작이 가능하다면 숏폼 콘텐츠를 넘어 단편 드라마까지 넘볼 수 있을 것 같다"고 설명했다.

 

반면 DALL-E가 초기 보였던 약점들도 고스란히 드러났다. DALL-E, 미드저니(Midjourney) 등은 공개 직후 인간의 손, 인파 묘사 등에 어려움을 겪었다. 이는 해당 객체들이 상호작용하는 경우가 많은 데다 비대칭적으로 운동하는 탓에 AI가 가능성을 예측하고 묘사하는 데에 어려움을 겪기 때문이다. 현재는 공개 후 이용자들의 사용을 통해 재학습한 데이터 셋 등을 통해 개선 된 상태다. 소라 또한 세밀한 표현에 한계가 있었다. 영상 속 인물들의 손가락이 2개 내지는 4개인 경우가 대부분이었고, 때로는 같은 얼굴의 사람들로만 군중을 만들기도 했다.

 

image
영어로 명령어 'otter(수달)'을 넣자 제대로 된 영상이 나왔지만 한글로 '수달'을 넣자 돌고래가 영상에 나왔다. /캡처

 

영어와 비영어권 언어에 따른 영상 제작 퀄리티 및 오류도 곳곳에서 발견됐다. 소라는 '수달'을 쓰자 엉뚱하게도 돌고래 영상을 만들어낸 뒤 수달이라고 표기했다. 그러나 'otter'로 바꿔 쓰자 수달이 강에서 즐겁게 노는 모습의 영상이 만들어졌다. 아직 소라는 엉성한 상태로 더욱 많은 학습과 규칙 설정이 필요한 상태로 보였다.

 

도널드 트럼프 대통령과 관련한 영상은 제작할 수 없도록 하고 있다. /캡처

한계는 계속 나타났다. '도널드 트럼프'를 명령어로 넣을 경우 소라는 "해당 콘텐츠는 금지됐다"고 명시하고 영상을 만들지 않지만, '한국의 대통령 윤석열'을 쓰면 아무런 문제없이 영상이 만들어졌다. 다만 만들어진 영상에서 윤석열은 실제 당사자가 아닌 누군지 모르는 아시아인의 얼굴을 하고 있었다.

 

놀랍도록 단순한 영상 제작은 이용자의 다양한 작업에 큰 도움이 될 것으로 보였다. 그러나 실제와 구분이 어려울 만큼 현실적인 묘사와 품질은 범죄에 오남용 될 수 있다는 우려를 낳았다. 앞서 DALL-E의 빠른 학습과 개선 속도를 고려한다면 오픈AI의 별도 제재 없이는 걷잡을 수 없는 범죄 도구가 될 게 뻔했다.

 

앞서 오픈AI는 소라를 공개한 후 소라의 위험성 방지를 위한 방안을 연구하는 전담 조직인 '레드 팀'을 운영하며 유해성을 사전 검증하고 있다며 AI 생성물에 식별 표지를 삽입할 예정이라고 밝혔다. 그러나 해당 식별 표지 자체도 오른쪽에 유심히 봐야 보이는 수준이기 때문에 큰 의미를 갖기는 어려워보였다. 현재 우리나라는 AI 기본법 조차 국회를 통과하지 못하는 등 생성형 AI 저작물과 관련된 어떠한 법안도 없는 상태다.

 

IT업계 관계자는 "식별 표지를 영상에서 잘라내는 것쯤은 어렵지 않다"며 "플랫폼 자체에 대한 책임을 강화함으로써 플랫폼이 AI를 통한 검증을 거치도록 하는 게 최선일 것"이라고 말했다.

 

트위터 페이스북 카카오스토리 Copyright ⓒ 메트로신문 & metroseoul.co.kr