Google, 이미지·동영상 생성 신모델 2개 공개

Google는 이미지 생성 모델 「Nano Banana 2 Lite」와 동영상 생성·편집 모델 「Gemini Omni Flash」 2개를 새롭게 발표했다. Nano Banana 2 Lite는 장당 약 4초·0.034달러로 이미지를 생성할 수 있으며, Gemini Omni Flash는 API를 통한 동영상 생성 기능을 처음으로 제공한다. Google은 이 2개 모델을 결합하여 정지 이미지에서 동영상으로 연결하는 활용 방법도 권장하고 있다.

Google이 생성 인공지능 모델 2개를 새롭게 발표했다. 이미지 생성용 「Nano Banana 2 Lite」와 동영상 생성·편집을 담당하는 「Gemini Omni Flash」이며, 후자는 API를 통한 동영상 생성 기능 제공으로서는 처음의 시도가 된다.

생성 인공지능을 둘러싸고는 이미지·동영상·음성 등 복수의 미디어를 다룰 수 있는 모델의 개발 경쟁이 계속되고 있다. 그 가운데에서도 크리에이터와 개발자가 손쉽게 사용할 수 있도록 속도와 비용을 양립시킨 경량 모델에 대한 수요가 높아지고 있으며, 이번 발표는 그러한 흐름에 부합하는 움직임으로 위치지어진다.

Nano Banana 2 Lite는 장당 약 4초로 이미지를 생성할 수 있는 모델이며, 이용 요금은 장당 0.034달러(약 5엔)로 설정되어 있다. 한편 Gemini Omni Flash는 텍스트에 의한 지시를 바탕으로 동영상의 생성 및 편집을 수행할 수 있는 모델로, API를 통해 외부의 개발자가 이용할 수 있는 형태로 제공된다. Google에 따르면 텍스트에서 동영상을 다룰 수 있는 모델을 API로 제공하는 것은 이번이 처음이라고 한다.

더 나아가 Google은 이 2개의 모델을 결합한 활용 방법도 권장하고 있다. 구체적으로는 먼저 Nano Banana 2 Lite로 정지 이미지를 빠르게 생성하고, 그 이미지를 Gemini Omni Flash에 넘겨 애니메이션 동영상으로 변환하는 일련의 흐름이다. 이러한 「모델의 연계(체이닝)」를 통해 텍스트 입력만으로 콘텐츠 제작 공정을 완결할 수 있다.

이번 2개 모델 공개가 지니는 의미는 속도와 비용이라는 실용적 측면의 정비에 있다. 4초라는 생성 속도와 장당 5엔 정도라는 가격대는 대량의 이미지를 다루는 업무나 프로토타입 제작을 반복하는 개발 현장에서의 이용을 상정한 것으로 보인다. 덧붙여 동영상 생성의 API 제공은 그때까지 제한된 환경에서만 이용할 수 있었던 동영상 인공지능 기술을 더 많은 개발자와 서비스에 개방하는 일보라는 견해가 가능하다.

텍스트에서 정지 이미지로, 정지 이미지에서 동영상으로 연결되는 일련의 파이프라인을 API로 완결할 수 있는 환경이 정비됨으로써, 콘텐츠 제작, 광고, 엔터테인먼트 등의 분야에서의 응용이 확대될 가능성이 있다. 향후에는 실제 이용 비용, 생성 품질, 타사 서비스와의 비교 등 실용적 측면에서의 평가가 초점이 될 것으로 보인다.

#생성AI#이미지생성#동영상생성#Google#API#멀티모달AI

AI issue 편집부

댓글을 작성하려면 로그인하세요