Technologiczne, Gadżety, Telefony Komórkowe, Pobieranie Aplikacji!

Stability AI wypuszcza SDXL (Stable Diffusion XL) Beta

Uwaga: Poniższy artykuł pomoże Ci w: Stability AI wypuszcza SDXL (Stable Diffusion XL) Beta

Wersja beta najnowszego modelu Stability AI, SDXL, jest już dostępna do podglądu (Stable Diffusion XL Beta). Mogli dostarczyć nam więcej informacji na temat modelu, ale każdy, kto chce, może go wypróbować. Zupełnie nowy model o nazwie SDXL jest teraz w fazie szkolenia. Nie wiadomo, czy po opublikowaniu zostanie nazwany modelem SDXL, i wciąż jest daleki od ukończenia. Można jedynie przypuszczać, że jest to bardziej rozbudowany model z większą liczbą parametrów i innymi usprawnieniami. Numer wersji to 2nie 3. Jest możliwe, że zmiany w modelu v2 zwiększą wydajność systemu, ale łatwiej jest wiedzieć o ile, jeśli ktoś wie więcej. Przydatna byłaby również wiedza o tym, które parametry zostały zmodyfikowane lub dodane w tej wersji.

Model SDXL można znaleźć w DreamStudio, oficjalnym generatorze obrazów dla Stability AI. Wykorzystuje wyrafinowane algorytmy i metody głębokiego uczenia się do generowania przyciągających wzrok obrazów, które dobrze nadają się do różnych usług. Przejdź do menu rozwijanego modelu i wybierz SDXL Beta, aby go wypróbować.

Model SDXL: jak go używać

DreamStudio, oficjalny twórca obrazu Stability AI, zawiera teraz model SDXL. Dostęp do modelu SDXL można uzyskać za pośrednictwem menu modelu; wybierz SDXL Beta.

Ulepszenia

Czytelny tekst

Zdolność SDXL do generowania czytelnego tekstu wyróżnia się najbardziej, ponieważ nie było to możliwe w przypadku poprzednich wersji 1 i 2.1 wersje. Jak widać na poniższym tekście dotyczącym stabilnej dystrybucji, tekst stworzony przez SDXL jest tylko czasami precyzyjny. Jest jednak znacznie lepszy od wersji 2.1 i wersja 1. Dzięki doskonałemu algorytmowi głębokiego uczenia SDXLs może rozumieć i tworzyć bardziej skomplikowane konstrukcje językowe. W miarę dalszego rozwoju może stać się jeszcze bardziej precyzyjny i godny zaufania.

Anatomia człowieka

Dyfuzja dźwięku od dawna boryka się z dokładnym generowaniem anatomicznie realistycznych modeli człowieka. Często zdarza się, że ludzie mają brakujące lub dodatkowe kończyny. Typowe metody naprawy obejmują malowanie, a ostatnio możliwość kopiowania postawy z obrazu referencyjnego przy użyciu funkcji Open Pose firmy ControlNet. Model SDXL Beta poczynił ogromne postępy w prawidłowym odtwarzaniu postaw ze zdjęć i był używany w wielu dziedzinach, w tym w animacji i wirtualnej rzeczywistości.

Styl portretowy

SDXL Beta to ulepszenie w stosunku do wersji 1.5, tworząc portrety wyglądające jak fotografie. Bardziej realistyczny i naturalny wygląd portretów uzyskuje się dzięki zastosowaniu zaktualizowanego algorytmu dostępnego w SDXL Beta. Poziomy ostrości i nasycenia mogą być modyfikowane przez użytkownika w celu uzyskania niestandardowych rezultatów.

dwutonowy

Z v1.5 wersji, termin duotone zawsze generuje obrazy monochromatyczne. Ale SDXL Beta generuje teraz zdjęcia bichromii w tęczy odcieni. Ulepszona szybka interpretacja modeli V2 doprowadziła do dokładniejszych i trafniejszych odpowiedzi, czyniąc je bardziej niezawodnym narzędziem do zastosowań NLP.

Style artystyczne

Były drobne poprawki, ale ponieważ nowy model jest inny, trudno powiedzieć, czy wyniki są lepsze. Nie jest łatwo wydać jednoznaczny werdykt na temat jakości tych modyfikacji, ponieważ mogą one być kwestią osobistego wyboru lub subiektywnej opinii. Jednak nowatorski charakter zmian może być interesujący i wymagać dodatkowych badań.

Zalety i wyniki

  • Rozpraszanie dźwięku może teraz generować logicznie brzmiący tekst.
  • W porównaniu do v2.1 i (w mniejszym stopniu) v1.5 wersjach, obrazy produkowane przez SDXL są bardziej atrakcyjne dla oka.
  • Nowy model generuje dokładniejsze obrazy.
  • Ludzkie ciało się rozwinęło.
  • Inaczej niż w v2.1monity wykluczające są teraz opcjonalne.
  • Może tworzyć realistyczne portrety.
  • Naukowcy naprawią kilka załamań w modelu, zanim go opublikują.

Kluczowe cechy

  • Użyj txt2img, aby przekształcić pisemne wyjaśnienia w oszałamiające efekty wizualne.
  • Można przenieść swoje zdjęcia na wyższy poziom za pomocą img2img.
  • Dzięki modelom do malowania można wybrać syntezę nowych części obrazu.
  • Żądanie obrazów zbiorczych: zrób kilka zdjęć jednocześnie.
  • Ekskluzywny ESRGAN x2Plus: teraz z dwukrotnie większą rozdzielczością (wypróbuj z img2img).
  • Obsługa wykresów X, Y i Z, umożliwiająca wizualne porównywanie danych wejściowych i wyników.

Ograniczenia

  • Możliwa niezgodność z innymi dodatkami. Przed zgłoszeniem problemu należy rozważyć usunięcie kolejnych wtyczek.
  • Dziesięć partii to maksymalna dozwolona liczba.
  • Nie wszystkie samplery obsługują funkcję Clip Guiding.