엔지니어를 위한 이야기 공장 AI 기술에 인문학의 온기를

하늘이라는 이름의 판도라 상자 : 소라가 열어버린 영상의 시대

하늘이라는 이름의 판도라 상자 : 소라가 열어버린 영상의 시대

1968년, 스탠리 큐브릭 감독의 〈2001 스페이스 오디세이〉가 극장에 걸렸습니다. 관객들은 우주 공간을 미끄러져 가는 디스커버리호의 모습을 보며 숨을 삼켰지요. 실사 촬영이 불가능한 그 장면을 만들기 위해, 큐브릭은 수개월 동안 정교한 미니어처와 프레임 단위의 합성 작업에 매달려야 했습니다. 그로부터 56년이 흘렀습니다.

2024년 2월 15일, 오픈(AI)는 영상 생성 AI 소라(Sora)를 세상에 내놓았습니다. 몇 줄의 문장만 입력하면 1분 길이의 고해상도 영상이 생성됩니다. 일본인 여성이 도쿄 거리를 걷는 풍경, 매머드가 눈 덮인 들판을 가로지르는 모습, 테이블 위에서 빙글빙글 도는 해적선의 커피잔 속 풍경까지 — 큐브릭이 평생 꿈꾸었던 장면들이 프롬프트 한 줄로 태어납니다.

소라라는 이름은 일본어로 '하늘空'을 뜻합니다. 오픈(AI)는 "무한한 창작의 가능성"을 상징한다고 했지만, 저는 이 이름이 다른 의미로도 읽힙니다. 하늘은 넓지만, 동시에 그 아래의 수많은 것들에 그림자를 드리운다는 의미 말입니다.

▸ 텍스트가 영상으로 번역되는 원리

소라는 세상에 없던 기술이 아닙니다. 기반은 두 가지 기술의 결합입니다.

첫째는 확산 모델(Diffusion Model)입니다. 이미지에 점진적으로 노이즈를 추가한 뒤, 역으로 노이즈를 제거하며 새 이미지를 만드는 방식이지요. 스테이블 디퓨전이나 달리(DALL-E) 같은 이미지 AI가 쓰던 방식입니다. 둘째는 트랜스포머(Transformer)의 어텐션 메커니즘입니다. 영상 전체에 걸쳐 인물의 외모, 배경의 연속성, 조명의 흐름을 일관되게 유지하는 역할을 합니다.

이 두 가지를 프레임 단위로 결합한 것이 소라의 본질입니다. 한 프레임씩 노이즈를 제거하여 그림을 만들고, 프레임끼리는 어텐션으로 묶어 연속성을 유지하는 식입니다. 어려운 말처럼 들리지만, 결과적으로는 '움직이는 그림'을 한 장 한 장 그리되, 앞 장면과 뒷 장면이 어긋나지 않도록 감독이 옆에서 지휘하는 것과 비슷합니다.

▸ 할리우드가 1년을 끌어오던 고민

소라의 공개가 무심한 사건이 아닌 이유는, 불과 몇 개월 전 할리우드에서 있었던 일 때문입니다. 2023년 7월, 미국 작가조합과 배우조합이 1960년 이래 처음으로 동시 파업에 들어갔지요. 그들이 피켓에 적은 문장은 한결같았습니다. "AI는 나의 연기를 훔칠 수 없다." 118일 동안의 파업 끝에 제작사는 '디지털 복제에 대한 동의와 보상'이라는 원칙을 받아들였습니다.

그런데 소라가 등장한 지금, 그 합의의 전제가 흔들리고 있습니다. 소라는 특정 배우의 얼굴을 훔칠 필요가 없습니다. 아예 실존하지 않는 인물을, 처음부터 AI로 만들어버리기 때문입니다. "내 얼굴을 쓰지 마"라는 요구는 여전히 유효하지만, "내 일자리를 뺏지 마"라는 요구는 이제 다른 차원의 문제가 되어버렸습니다.

조연, 엑스트라, 스톡 푸티지, 광고용 짧은 영상 — 그동안 많은 무명 배우들과 신진 창작자들이 경력을 쌓아 올리던 계단의 아랫부분들입니다. 소라는 그 계단의 아랫단부터 조용히 먹어치울 가능성이 높습니다. 주연이 모두 AI인 영화는 당분간 나오기 어렵겠지요. AI 생성물에는 저작권이 인정되지 않기 때문에 상업적 위험이 너무 크니까요. 하지만 '보이지 않는 곳'부터 대체된다는 점은 분명합니다.

▸ 창작의 민주화라는 양날의 검

그렇다고 소라가 어두운 예언만 담은 도구는 아닙니다. 한 발 물러서 보면, 이 도구는 그동안 영상 제작의 문턱 앞에서 멈춰섰던 수많은 이야기꾼들에게 길을 터주는 도구이기도 합니다. 수억 원의 제작비 없이도, 수십 명의 스태프 없이도, 한 사람의 작가가 머릿속에 있던 장면을 바깥으로 꺼낼 수 있게 된 것이니까요.

1839년 다게레오타이프 사진기가 처음 등장했을 때, 초상화가들은 자신의 직업이 끝났다고 한탄했습니다. 그러나 그들 중 일부는 사진이라는 새로운 매체의 초기 작가로 변신했고, 또 다른 일부는 사진이 할 수 없는 것 — 인물의 영혼을 해석하는 일 — 으로 방향을 틀었습니다. 오늘날 직업 사진가도 있고, 직업 초상화가도 여전히 존재합니다. 기술이 직업을 한 번에 쓸어버리는 일은 생각보다 드물지요.

다만 소라가 가져올 변화의 속도는 다게레오타이프 때와는 비교가 되지 않을 것입니다. 사진기의 보급에 반세기가 걸렸다면, 소라는 아마 5년 안에 광고 영상의 상당 부분을, 10년 안에 드라마 배경 장면의 많은 부분을 잠식할 가능성이 있습니다. 국내 웹툰·애니메이션 제작 현장에서도 AI 기반 도구로 제작 기간을 크게 줄이려는 실험이 조용히 진행되고 있다는 이야기가 들려오고 있으니까요.

▸ 그 하늘 아래 우리는 무엇을 할 것인가

소라는 도구입니다. 도구는 그 자체로 선하거나 악하지 않습니다. 문제는 이야기를 만드는 근본적인 힘이 어디에서 나오는가 하는 질문입니다. 저는 그 자리에 여전히 인간이 앉아 있다고 믿습니다. 소라에게 "도쿄 거리를 걷는 일본인 여성"이라는 한 줄을 던져준 그 사람의 상상력 말입니다.

2024년 2월, 오픈(AI)는 소라의 초기 테스트 버전을 소수 창작자와 레드팀(Red Team)에게만 공개했습니다. 일반 대중에게 풀리기까지는 시간이 걸릴 것입니다. 그동안 우리는 조심스럽게 질문해야 합니다. 무엇을 금지할 것인지가 아니라, 무엇을 지킬 것인지를요. 인간 창작자의 원작료, 무명 배우의 생계, 그리고 무엇보다 "이 이야기가 왜 가치 있는가"를 판단할 수 있는 우리의 감각 말입니다.

하늘은 넓습니다. 하지만 그 하늘 아래에서 누군가는 날아오르고, 누군가는 그늘에 들어섭니다. 2024년의 오늘, 그 둘을 가르는 것은 기술이 아니라 기술을 다루는 우리의 태도일 것입니다.

#sora #openai #생성형AI #영상AI #엔터테인먼트