텍스트 입력만으로 오디오·3D 생성 연구
“생성형 AI로 창의력·생산성 도모” 강조
세계 최대 콘텐츠 제작 소프트웨어(SW) 전문기업 어도비가 자사 생성형 인공지능(AI) 모델군 ‘파이어플라이’ 생태계 확장에 속도를 내고 있다. 텍스트를 입력해 이미지와 동영상을 만들어 내는 AI에 이어, 그다음 단계로 3D(3차원)와 오디오까지 자동 생성할 수 있는 대규모 모델 개발에 착수했다.
알렉산드루 코스틴 어도비 생성형 AI 총괄 부사장은 15일(현지 시간) 미국 플로리다주 마이애미에서 열리고 있는 세계 최대 크리에이티브 콘퍼런스 ‘어도비 맥스 2024’(Adobe MAX 2024) 현장에서 이러한 내용을 담은 어도비의 생성형 AI 로드맵에 대해 밝혔다.
이날 아시아·태평양 지역 취재단과 만난 코스틴 부사장은 “어도비가 가진 최대 특장점이 콘텐츠 창작에 대한 투자”라며 “(현재) 3D 생성형 AI 모델과 오디오 모델을 연구하고 있다”고 말했다.
어도비는 지난해 3월 처음으로 텍스트를 이미지로 바꿔주는 생성형 AI ‘파이어플라이 이미지 모델’(베타 버전)을 내놓은 이후 그해 가을 사용자 지정 스타일로 2D 콘텐츠를 만들어 낼 수 있는 ‘생성형 매치’ 기능이 업계 최초로 탑재된 ‘이미지 2 모델’을 선보인 바 있다. 이후 기존 모델보다 4배 더 빠르게 고품질 이미지를 생성하는 ‘이미지 3 모델’을 이번 어도비 맥스 2024 행사를 통해 공개하기도 했다.
이 과정에서 어도비는 벡터 그래픽 제작에 중점을 둔 세계 최초의 생성형 AI 모델인 ‘파이어플라이 벡터 모델’과 텍스트를 템플릿으로 구현할 수 있는 ‘파이어플라이 디자인 모델’을 업계 처음으로 선보이기도 했다.
어도비는 전날 영상 촬영분에서 중간중간 빠진 부분이 있을 경우 AI가 앞뒤 흐름에 맞는 영상을 만들어 컷과 컷 사이의 간극을 채워주는 생성형 동영상 AI 솔루션을 공개한 바 있다.
코스틴 부사장은 어도비 AI의 후속 모델을 묻는 질문에 “현재도 오디오 백그라운드 익스텐션(배경음 확장)을 통해 오디오를 2초 정도 늘릴 수 있는 등 기존 오디오 모델이 있다”면서도 “그러나 음악을 (자동) 생성하는데 있어 임팩트 있는 생성이 중요한 만큼, 영상이 보다 더 생생하게 느껴질 수 있도록 음향 효과와 음악을 만들어 내는 (진보된) 생성형 오디오 모델을 강구하고 있다”고 전했다.
가령 눈길을 걸어가는 영상에서 배경음으로 실존하는 음향처럼 구현할 수 있는 오디오 AI를 염두에 두고 있다는 얘기다. 그는 또 “3D 모델 역시 연구하고 있고, 이러한 모델들은 우리가 전문성을 갖고 (기술력을 확보해 나가고 있는) 전문 영역”이라고 설명했다.
다만 코스틴 부사장은 후속 모델 공개 시점을 공언하지 않았다. 그러나 이미지·동영상 AI를 불과 1년여 차이로 잇달아 내놓았다는 점에서 3D와 오디오 생성 모델 역시 속도감 있게 출시할 수 있을 것으로 보인다.
이와 관련해 어도비는 이날 부대 행사인 ‘맥스 스닉스’(MAX Sneaks)에서 텍스트 입력 만으로 오디오와 3D 객체가 생성되는 신기술을 시현하며 관련 프로젝트의 상용화가 임박했음을 예고하기도 했다.
맥스 스닉스는 어도비가 현재 역점 과제로 추진하고 있는 주요 프로젝트를 소개하고 향후 시장의 반응과 기술 완성도 등에 따라 시현한 기술이 어도비 제품군에 탑재될 수도, 혹은 그렇지 않을 수도 있다.
한편 코스틴 부사장은 시각물을 만들어내는 비전AI 영역에서 자사 AI 모델군인 파이어플라이 뿐만 아니라 타사 모델도 차용 할 수 있음을 시사했다.
지난 4월 어도비는 전문 편집자가 향후 오픈 AI와 런웨이의 영상 생성 모델을 활용해 B-롤을 생성하거나, 피카 랩스를 통해 장면 끝에 몇 초의 영상을 추가하는 초기 단계의 모습을 공개해 서드 파티(제 3자) 모델 도입 가능성을 불러일으킨 바 있다.
코스틴 부사장은 다른 생성형 AI 전문 기업과의 협업 계획을 묻자 “고객들이 필요하다고 판단이 된다면 다른 모델도 개방할 수 있을 것”이라고 답했다. 그러면서 그는 “(이러한 협업의 영역은) 콘텐츠 편집 영역이나 표준화된 이미지 기술을 활용하는 부분, 디지털 이미지와 비디오를 활용하는 일련의 섹터에서 타진할 수 있지만 현재 시점에서는 (공개적으로) 말할 수 있는 부분이 없다”며 말을 아꼈다.
현재 어도비는 몇몇 빅테크 기업과 여러 가능성을 열어 놓고 프리미어 프로 등 자사의 주요 창작 툴에 타사의 AI모델을 추가하는 방안 등을 검토하고 있는 것으로 알려졌다. 가령 프리미어 프로에서 비디오 속 부족한 영상을 AI가 자동으로 메워주는 ‘생성형 확장’ 기능을 활용할 때, 이용자가 모델 선택 사항으로 어도비의 파이어플라이와 타사 모델 등을 놓고 골라 사용할 수 있다는 식이다. 생성형 확장은 지난 14일부터 프리미어 프로를 통해 서비스되기 시작됐다.
코스틴 부사장은 “생성형 AI는 (모든 테크 기업에게 있어) 비슷한 시점에 와 있다”면서 “어도비는 기술 혁신인 생성형 AI를 (포토샵·일러스트레이터 등) 플랫폼에 적용해 창작자들의 생산성을 높이고 창의적인 콘텐츠를 만들 수 있게 지원할 것”이라고 강조했다.
아울러 그는 “이용자들이 생성형 AI를 활용해 보다 더 쉽게 자신이 하고 싶은 이야기를 구현하고, 그만큼 시간을 아낄 수 있도록 하는 것이 우리의 목표”라며 “우리는 생성형 AI가 전문가 등 더 많은 사람들이 생산적인 창작을 할 수 있게 하는 천장을 높이고, (기술과 창의성을 위해) 장벽을 낮추는 방향으로 제품을 강화해 나갈 것”이라고 전했다. [마이애미 고민서 기자]