[그것이 궁금] 생활 깊숙이 침투한 '인공지능', 미디어가 내 취향을 아는 방법
[그것이 궁금] 생활 깊숙이 침투한 '인공지능', 미디어가 내 취향을 아는 방법
  • 이주영
  • 승인 2021.07.12 14:23
  • 댓글 0
이 기사를 공유합니다

엔터테인먼트산업에서 디지털 전환이 빠르게 일어나는 가운데 인공지능이 디지털 전환을 통한 사업모델 혁신의 핵심적인 역할을 맡고 있다.

하지만 새로운 기술과 서비스가 엔터테인먼트 산업에 확산될 수 있을지, 어떠한 변화를 만들어낼지는 아직 미지수다.

인공지능 기술의 확산은 개인정보 유출에 대한 우려와 함께 인공지능 윤리와 관련한 숙제도 남기고 있다. 영상과 그래픽 분야에서 활용되는 딥페이크(deepfake) 기술은 가짜뉴스 생산 및 각종 범죄에 이용되고 있다. '이루다' 사태에서 보듯 인공지능이 이용자의 데이터를 바탕으로 학습한다는 것을 이용하여 문제가 있는 데이터를 학습시키는 방식으로 인공지능을 오용하는 경우도 있다.

인공지능의 발달과 함께 데이터의 가치가 높아지면서 데이터에 포함된 개인정보의 가치 또한 높아지고 있다. 정교한 개인화 추천 알고리즘을 만들기 위해서는 그만큼 세세한 개인정보의 수집 및 분석이 필요하기 때문이다. 기업은 다양한 방식으로 자사의 콘텐츠 · 서비스 · 디바이스 이용자의 개인정보를 기록하고 저장한다.

이용자의 개인정보 데이터가 충분하게 보호받고 적절하게 관리되고 있는지, 예를 들어 ‘이루다’ 사태처럼 기업이 수집한 데이터가 외부로 유출될 우려는 없는지 등에 대해 우려하는 이유이다.

이와 관련해 정부가 저작권법 개정을 준비하고 'AI 개인정보보호 자율점검표', '인공지능 기반 추천 서비스 이용자 보호를 위한 기본 원칙' 등 가이드라인을 공개하여 논의를 진행하고 있다. 2021년 4월 개인정보위원회가 이루다의 개발사인 '스캐터랩'에 과징금/과태료를 부과한 결정을 하기도 했다.

 

(사진=게티이미지뱅크)
(사진=게티이미지뱅크)


인공지능이란 무엇이고 어떤 유형들이 있을까?

인공지능이라는 용어는 1956년 다트머스 대학에서 열린 콘퍼런스에서 존 메카시가 처음 사용했다.

그에 따르면 인공지능은 "지능적 기계를 만드는 과학과 공학, 특히 지능적 컴퓨터 프로그램을 의미한다" 메카시는 상식의 형식화와 추론이라는 관점에서 인공지능에 접근했다. 

이는 컴퓨터 프로그램 차원에서 고도의 알고리즘 체계로 구현되며 고도의 알고리즘이 빅데이터와 결합하면 인공지능은 인간의 개입 없이도 진화하고 사고한다.

인공지능이 일련의 작업을 수행하기 위해서는 네 가지 단계를 거쳐야 한다. 먼저 상호작용(Interaction)을 통해 인간 혹은 대상으로부터 입력받은 데이터를 컴퓨터가 이해할 수 있는 방식으로 변환해야 한다. 다음 단계는 학습(Analytics)으로 머신러닝, 딥러닝 등의 기법을 활용하여 데이터로부터 판단을 위한 패턴을 학습한다. 세 번째인 추론(Inference) 단계에서는 학습된 패턴을 통해 데이터의 의미를 판단하거나 결과를 예측한다. 마지막 수행(Performance) 단계에서는 추론 결과를 바탕으로 실제적인 작업을 수행한다.

 

인공지능과 미디어 엔터테인먼트산업의 만남

엔터테인먼트 산업에서 콘텐츠를 만들기 위한 첫 단계는 성공 가능성이 큰 이야기(storytelling) 콘텐츠를 개발 및 확보하는 일이다. 인공지능 기술은 이야기의 성공 가능성을 판단하는 데 활용된다. 예를 들어 넷플릭스(Netflix)는 <하우스 오브 카드(House of Cards)>를 기획 · 제작하는 과정에서 인공지능을 통해 분석한 시청자들의 이용 행태를 참고했다.

이와 유사하게 최근 몇 년간 할리우드에서는 시네리틱(Cinelytic), 스크립트북(Scriptbook), 볼트(Vault), 파일럿(Pilot) 등 영화 시나리오를 판단하여 흥행을 예측하는 인공지능 서비스가 연달아 출시되었다.

시네리틱의 전문가 시스템 작동원리는 다음과 같다. 기존 영화의 흥행실적 데이터를 바탕으로(상호작용), 머신러닝을 통해 흥행작의 패턴을 학습하고(학습), 총 19가지 속성을 바탕으로 미래의 이익을 추론함으로써(추론), 시나리오의 흥행 전망 및 효율적인 재무 모델을 제안한다(수행). 제작자들의 경험 및 직관보다 더 객관적인 예측을 도출할 수 있다는 기대에 힘입어 시네리틱은 2020년 워너브러더스(Warner Bros.)와 계약을 맺었다.

스스로 학습하고 진화하는 인공지능의 출현은 독자적으로 콘텐츠를 창작하는 인공지능의 가능성에 대한 기대와 관심을 불러일으켰다.

엔터테인먼트 산업의 관점에서 눈여겨볼 만한 성과는 음악 영역에서 나타나고 있다. 영상과 음성 콘텐츠의 중요성이 커지면서 저작권 걱정 없이 간단한 배경음악으로 사용할 수 있는 음원에 대한 수요가 커졌는데, 인공지능을 활용한 음악 창작은 여기에 하나의 돌파구가 되고 있다.

2012년 영국에서 공개된 쥬크덱(Jukedeck)은 이용자의 취향에 맞춰 음악을 자동으로 생성하는 인공지능 작곡 시스템이다. 2019년에는 틱톡(TikTok)의 모기업인 바이트댄스(Bytedance)에 인수되어 이용자들이 만드는 숏폼 콘텐츠의 배경음악 제작에 활용되고 있다. 이외에도 구글(Google)과 소니(Sony) 등이 관련 기술을 실험하고 있으며 네이버도 인공지능 작곡 스타트업 포자랩스에 대한 투자를 지속하고 있다.

창작의 폭과 깊이는 인공지능과 인간이 협업할 때 더 커진다. 2019년 한국의 업보트엔터테인먼트가 개발한 ‘아이즘(AISM)’은 딥러닝을 활용한 인공지능 작곡 프로그램이다.

클래식 자장가, 한국과 미국의 전래동요를 학습한 다음 모차르트의 ‘반짝반짝 작은 별’ 같은 참고 음악을 제시하면 이와 유사한 수 백개의 곡을 창작해 낸다. 상품화를 위해 인공지능이 작곡한 곡을 인간이 최종적으로 선정하여 다듬는 과정을 거친다는 것이 단독 창작과의 차이다.2020년부터 발표하기 시작한 인공지능 동요 앨범은 스트리밍 플랫폼 지니뮤직에서 약 21만 회 재생됐다.

인공지능이 창작한 시나리오를 영상화하는 작업도 꾸준히 시도되고 있다. 2020년 미국 채프먼대학교 학생들이 인공지능 ‘GPT-3’을 활용해 단편영화 시나리오를 작성하고 영화화한 것이 최근의 사례다.

인공지능 연구소 오픈AI(OpenAI)가 2020년 발표한 GPT-3은 방대한 데이터를 학습해 고차원적 추론의 결과를 인간다운 텍스트로 만들어내는 언어지능으로서 인간처럼 대화하고 글을 쓸 수 있다. 채프먼대학교 학생들은 이를 활용하여 <방문 판매원(Solicitors)>이라는 단편영화 시나리오를 작성하고 영화화했다. 약 3분 정도 길이의 영화는 20초부터 “여기부터 인공지능이 쓴 이야기입니다.”라는 자막과 함께 GPT-3가 만든 대사를 보여줬다.

 

인공지능의 콘텐츠 창작

인공지능은 콘텐츠 제작의 도구로 활용되어 전체적인 제작 환경의 효율성을 개선하거나 새로운 제작 방식을 가능하게 만든다. 이미지, 영상, 게임 등의 분야에서 이와 같은 시도가 활발하다. 2021년 오픈AI는 텍스트를 입력하면 관련된 이미지를 자동으로 생성하는 인공지능 ‘달리(DALL-E)’를 발표했다. 예를 들어 ‘아보카도 모양의 안락의자’를 입력하면 달리는 아보카도를 반으로 자른 형태의 의자에 씨 모양의 쿠션을 추가한 디자인을 만들어낸다.

영상 제작에서 인공지능은 촬영, 편집, 스케줄 관리 작업 등에 쓰인다. 미국 엔드큐(End Cue)의 ‘애자일 프로듀서(Agile Producer)’는 각본 분석을 통해 촬영에 필요한 캐릭터, 소품, 오디오/비디오 효과 등 다양한 요소들을 추출하고, 배우의 스케줄, 촬영 장소, 장비, 날씨 및 예산 등을 고려하여 최적의 스케줄을 자동으로 관리한다.

이스라엘의 픽셀롯(Pixellot)은 인공지능과 클라우드를 활용한 무인 스포츠 중계 콘텐츠 제작 시스템이다. 경기장에 설치된 무인 다중 카메라가 경기장 전체를 파노라마 촬영하여 클라우드에 저장하면, 클라우드의 인공지능이 경기 상황에 따라 적절한 부분을 편집하여 방송에 내보낸다.

SK텔레콤과 카카오VX도 인공지능을 활용한 스포츠 중계에 박차를 가하고 있다. 2021년 6월부터 골프 중계에 도입될 인공지능 기술은 주요 장면을 실시간으로 자동 편집하는 한편, 선수의 퍼팅 라인을 예측해 보여준다.

그래픽 작업에도 인공지능이 널리 쓰인다. 2019년 넷플릭스를 통해 개봉한 영화 <아이리시맨(The Irishman)>은 주연 배우의 얼굴에 별도의 마커를 붙이거나 HMC(Head-Mounted Camera)를 씌우지 않은 채 인공지능을 활용해 배우들의 젊은 시절 얼굴을 재연하는 기술을 선보였다.

2020년 공개된 게임 <사이버펑크 2077(Cyberpunk 2077)>은 머신러닝 기반 인공지능 기술을 활용하여 11개 언어 버전에서 캐릭터의 입 모양과 대사를 완전히 일치시켰다. 2021년 tvN에서 방영한 드라마 <나빌레라> 역시 인공지능을 활용해 발레 장면의 대역 안무와 주연 배우의 얼굴을 자연스럽게 합성한 모습을 보여줬다.

 

개인화된 콘텐츠 추천

콘텐츠 큐레이션, 그 가운데서도 '개인화된 추천(Personalized recommendation)'은 인공지능을 활용한 콘텐츠 서비스의 대표적인 유형이다. 이용자의 콘텐츠 이용 데이터를 학습하여 패턴을 발견하고 이용자가 시청할 것으로 예상되는 콘텐츠를 추론해 사전에 분류 및 배치해 최적 의 맞춤형 서비스를 제공한다.

넷플릭스가 2006년 10월부터 2009년 7월까지 약 3년에 걸쳐 진행한 알고리즘 경진대회(Netflix Prize)를 통해 산업 전반에 널리 퍼졌으며, 특히 영상, 음악, e-커머스 등 플랫폼 비즈니스를 중심으로 하는 기업의 핵심 경쟁력으로 자리매김하고 있다.

음악을 듣는 방식이 스트리밍으로 바뀌면서 음악 플랫폼에서 개인화된 추천 서비스의 중요성도 커졌다. 2018년 스트리밍 플랫폼 '바이브(VIBE)'와 '플로(FLO)'가 인공지능 기술을 바탕으로 음악 서비스를 시작했다. 

플로의 경우 이용자의 30%가 인공지능이 추천한 음악과 맞춤형 플레이리스트를 통해 음악을 듣는다. 2021년 한국 서비스를 시작한 '스포티파이(Spotify)' 역시 개인화된 서비스를 앞세운다. 

주요 음악 플랫폼이 스트리밍을 넘어 팟캐스트, 오디오북 등 오디오 콘텐츠 전반을 강화하면서 음악산업에서 개인화된 추천 서비스의 영향력은 더욱 커질 전망이다.

미디어 콘텐츠와 e-커머스가 밀접하게 연관된 패션 산업에서도 개인화된 맞춤 서비스는 중요한 비즈니스 모델 중 하나다. 미국의 온라인 패션 플랫폼 '스티치 픽스(Stitch Fix)'는 빅데이터와 인공지능을 활용해 이용자에게 최적의 스타일링을 제안하고 큐레이팅한 선물상자를 사용자의 집까지 배송하는 서비스를 선보인다. 2017년 나스닥에 상장한 기업 가치는 현재 3조 4,000억 원에 달한다. 

한국에서는 정부 지원을 통해 개발된 '마이 스타일 랩'이 2020년부터 서비스를 시작했고, 카카오커머스가 운영하는 '카카오스타일' 역시 2020년부터 개인화 추천 서비스를 제공하고 있다.
 

디지털아바타와 메타버스의 인기

미국의 AI 스타트업 '미러 AI(Mirror AI)'는 셀카(selfie)를 개인의 애니메이션 이모티콘으로 변환할 수 있는 서비스를 제공한다. 애플이 iOS13버전부터 지원한 '미모티콘(MEmoticon)' 서비스는 카메라를 통해 이용자 자신을 닮은 이모티콘을 만들고 이를 다양한 앱에 활용할 수 있도록 한다.

이모티콘이 이미지에서 움직이는 애니메이션으로 발전하고 다양한 앱을 통해 폭넓은 방식으로 활용되면서, 이모티콘은 점차 디지털 아바타에 가까운 형태로 발전하고 있다. 

최근 메타버스 플랫폼으로 주목받는 제페토 역시 인공지능을 활용해 캐릭터를 생성하고 꾸미는 '스노우(SNOW)' 앱에서 시작했다. 

이를 별도의 서비스로 출시하여 아바타들이 자유롭게 놀 수 있는 가상공간을 구현한 것이 지금의 제페토이다. 제페토는 현재 글로벌 가입자 2억 명을 돌파하며 국내 메타버스 플랫폼의 선두주자로 자리잡고 있다.

영상 분야에서도 디지털 아바타의 활용 가능성은 크게 점쳐지고 있다. 2020년에는 MBN종합뉴스의 김주하 아나운서를 본뜬 디지털 아바타가 뉴스를 진행했고, 2019년에는 중국CCTV의 구정 특집 프로그램에서 실제 인간과 이를 본뜬 인공지능 MC가 함께 프로그램을 진행하는 모습이 방영됐다. 

새로운 엔터테인먼트 경험을 제공할 뿐 아니라, 스크립트를 입력하기만 하면 곧바로 실시간 진행이 가능하다는 것이 장점이다. 이 같은 장점에 주목한 정부는 현재 인공지능 아바타를 활용해 음성을 자동으로 수어로 변환하거나 감정을 음성으로 변환하는 기술을 개발 중이다.

 

 

 

※  자료 = 한국방송통신전파진흥원의 "2021 미디어 이슈&트렌드 2021년 5·6월호 인공지능과 미디어 엔터테인먼트산업" 보고서


관련기사