Platforma Stabilna dyfuzjajeden z najpopularniejszych modeli językowych bazujący na sztucznej inteligencji tworzącej ilustracje, zapowiada ewolucję. Od teraz może także tworzyć filmy.
Zaprezentowane w ten wtorek (21), Nowa funkcja Stability nazywa się Stable Video Diffusion i jest pierwszym generatywnym modelem firmy dla animowanych klipóww oparciu o istniejące narzędzia i z wynikami, które wydają się imponujące.
Poniżej znajduje się podgląd możliwości modelu wideo Stable Video Diffusion:
Według Stability pomysł zakłada wykorzystanie tej technologii w takich dziedzinach, jak reklama, edukacja i rozrywka, a także w kilku innych sektorach.
Jak działa stabilna sztuczna inteligencja wideo dyfuzyjna
Generacyjna sztuczna inteligencja wideo firmy jest w stanie w ciągu kilku sekund utworzyć animacje w dwóch lub trzech wymiarach na podstawie poleceń tekstowych użytkownika. Działa według tej samej logiki, co inne podobne usługi, zapewniając bardziej złożone i dokładne wyniki w zależności od ilości szczegółów w monicie.
Wykorzystuje te same podstawy techniczne, co kreator obrazu statycznego do generowania ilustracji, generując poruszającą się treść od 14 do 25 różnych klatek z szybkością ruchu do 30 klatek na sekundę.
Oprócz wpisów tekstowych potrafi także przekształcać statyczne obrazy w animacje, czyli „ożywiać” zdjęcia czy rysunki.
Według Stability generatywna sztuczna inteligencja została przeszkolona na podstawie „milionów filmów zebranych z Internetu” i udoskonalona na mniejszej próbce składającej się z około miliona klipów. Obecność lub brak materiałów chronionych prawem autorskim w tym zestawie nie została jednak w pełni wyjaśniona przez firmę.
Co więcej, przynajmniej na razie nadal istnieją ograniczenia w tworzeniu, jeśli chodzi o kadrowanie, efekty kamery, czas trwania i reprezentację ludzkich twarzy.
Jak używać sztucznej inteligencji wideo ze stabilną dyfuzją?
Na razie wypuszczono Stable Video Diffusion tylko w wersji poglądowej dla badaczy w terenie. Każdy, kto chce korzystać z platformy, obecnie musi podpisać zobowiązanie do przestrzegania zasad narzędzia, w tym do niereprezentowania prawdziwych ludzi w kreacjach.
Kod został udostępniony w repozytorium GitHub i można przeczytać więcej szczegółów technicznych w badaniu akademickim opublikowanym przez zespół (w języku angielskim).