Д окато надпреварата в технологичната индустрия към изкуствен интелект за генериране на видео накара някои гиганти да натиснат спирачките, Google ускорява. В серия от големи актуализации на Google Vids, приложението за създаване на видеоклипове за Workspace, Google обяви дълбоката интеграция на най-модерните си генеративни модели: Veo за видео и Lyria за висококачествено аудио.
Конкуренти като OpenAI напоследък предприеха по-предпазлив, „отдръпващ се“ подход към видеоклипове с изкуствен интелект, позовавайки се на опасения за безопасността и разходи за изчисления. Като прехвърля тези най-съвременни инструменти директно в ръцете на корпоративни и креативни потребители, Google се опитва да популяризира видеото с изкуствен интелект като стандартна офис програма.
Актуализацията позволява на всеки с акаунт в Google да генерира кратки видеоклипове от прости текстови подкани или изображения безплатно. Потребителите могат да създават до 10 видеоклипа на месец безплатно, което драстично намалява бариерата за навлизане в сферата на създаването на видеоклипове. За платените абонаменти лимитът е цели 1000 клипа месечно.
AI не успява да спечели доверието на хората
За Google стратегията е свързана както с достъпността, така и с възможностите. Това, което някога изискваше камери, софтуер за редактиране и техническа експертиза, сега може да се направи за секунди в браузър. Ново разширение за Chrome дори позволява на потребителите да записват екрана си и да го интегрират в проекти, докато директното публикуване в YouTube опростява разпространението.
В основата на тази актуализация е Veo, най-добрият модел за генериране на видео на Google до момента. Способен да създава кинематографични 1080p клипове от прости текстови подкани, Veo позволява на потребителите да генерират преходи и визуализации, без дори да хващат камера.
Учени от Станфорд: Изкуственият интелект ни лъже, за да ни угоди, и убива критичното ни мислене
OpenAI изненадващо спира Sora, след като погълна милиарди без печалба
В комбинация с Lyria, специализирания музикален и вокален модел на Google, потребителите вече могат да генерират персонализирани, 30-секундни фонови записи, които съответстват на емоционалната среда на тяхното видео. Независимо дали става въпрос за професионален ритъм за основна презентация или за оптимистичен музикален фон за обучителен клип, изкуственият интелект се грижи за аранжимента, темпото и дори за реалистичните многоезични озвучавания.
Друга ключова функция е въвеждането на персонални AI аватари. Тези дигитални презентатори могат да бъдат насочвани, стилизирани и поставяни в сцени, което улеснява създаването на уроци, маркетингови клипове или вътрешни комуникации. За разлика от по-ранни реализации, аватарите на Google могат да взаимодействат с обекти и да поддържат последователна идентичност в различните сцени, придавайки по-„продукционно“ усещане на генерираното от AI съдържание.
За жените и мъжете ползите и рисковете от AI са различни
Важно е да се отбележи, че Google набляга на отговорното използване. Макар че не винаги е откроявано като водеща функция, компанията продължава да вгражда предпазни мерки в своите генеративни инструменти, фокусирайки се върху предотвратяване на злоупотреба, ограничаване на вредното съдържание и гарантиране, че резултатите са съобразени с „добронамерената“ творческа употреба. Тези контроли отразяват нарастващия натиск от индустрията за балансиране на иновациите с доверието, особено тъй като генерираните от изкуствен интелект медии стават все по-реалистични.
Новият ChatGPT е създаден да бъде най-умният работник
Ще вземат ли AI агентите работата на най-младите
Всички видео и аудио файлове, генерирани от Veo и Lyria, включват невидим, защитен цифров воден знак, който идентифицира съдържанието като генерирано от изкуствен интелект. Моделите са програмирани да отхвърлят подкани, включващи реални публични личности, неприлично съдържание или сценарии с „вредни намерения“. За потребителите на Workspace Google гарантира, че данните, използвани за подкани към изкуствения интелект, остават в защитения „балон“ на организацията и никога не се използват за обучение на основните публични модели.