Jeśli natknąłeś się na dziwne cyfrowe obrazy, takie jak „Żyrafa w kosmosie” lub „Darth Vader na gitarze elektrycznej”, to prawdopodobnie sztuczna inteligencja Dall-E robi obecnie furorę na Twitterze.
Być może, podobnie jak ja, od kilku dni Twoja oś czasu na Twitterze jest wypełniona dziwnymi cyfrowymi obrazami utworzonymi przez Dall-E Mini AI; Obrazy takie jak Karol Marks stworzony dzięki odwilży telewizyjnej, Postać Waltera White’a z konsolą Gamecube w dłoni; Gordon Ramsey jedzący Big Maca Lub żaba z obrazu Krzyk Edwarda Muncha.
The Dall-E Mini usługa hostowana na stronie internetowej Hugging Face wykorzystuje sztuczną inteligencję do wycinania miliardów obrazów z Internetu w celu utworzenia stosunkowo odpowiednich obrazów tekstu przesyłanego przez użytkownika; Nawet jeśli wpisany tekst wygląda jak powyższe przykłady, jest dziwny i surrealistyczny i nie można go znaleźć w prawdziwym świecie. Na przykład wypróbowałem na tej platformie frazę „iPhone kucyk w ręku” i uzyskałem następujące obrazy.
„Dzieło” Dall-E Mini jest tak znane i wszyscy o nim mówią ze względu na fantastyczną zdolność sztucznej inteligencji do tworzenia obrazów pomysłów, na które nikt wcześniej nie wpadł.
Na przykład, jeśli wyszukasz w Google hasło „Gandalf w statku kosmicznym”, nie uzyskasz pożądanego rezultatu. Mimo to dokładna fraza pokazuje stosunkowo trafne wyniki na platformach generujących obraz, takich jak Dall-E Mini.
Co kilka lat pojawia się technologia, która dzieli świat przed i po sobie. Na przykład dobrze pamiętam moment, w którym po raz pierwszy „odtworzyłem” piosenkę, pierwszą rozmowę wideo, którą przeprowadziłem za pomocą Vibera, czy pierwsze zdjęcie, które zrobiłem 2-megapikselowym aparatem, a następnie wrzuciłem na Instagram z prostym filtrem.
Tym, co sprawia, że te chwile są niezapomniane, jest postrzeganie nieprzewidywalnych i zaskakujących wydarzeń, które mogą stać się możliwe wraz z pojawieniem się tych technologii. Teraz możesz nawiązać połączenie wideo z dowolnym plikiem z dowolnej chmury lub połączyć się z tysiącami ludzi na całym świecie za pośrednictwem transmisji strumieniowej na żywo i Wi-Fi.
Od kilku lat nie było żadnych wieści na temat tego typu technologii; To właśnie chcemy pokazać naszym przyjaciołom i muszę powiedzieć, że to trzeba zobaczyć! Oczywiście Dall-E Mini, jak sama nazwa wskazuje, to tylko minimalny przykład wspaniałej, przyszłościowej technologii, która może kształtować przyszłość; Świat algorytmów i sztucznej inteligencji.
Dall-E Mini; Nowa rozrywka dla użytkowników sieci społecznościowych
Dall-E Mini to projekt programisty z Teksasu Borisa Daymy, który opracował w lipcu 2021 r. w celu wzięcia udziału w konkursie komputerowym AI sponsorowanym przez Google i firmę zajmującą się technologią uczenia maszynowego Face.
Projekt, który jest obecnie hostowany na stronie internetowej „Przytulona twarz”., stało się obecnie tak popularne dzięki szumowi na Twitterze, że ruch na stronie jest tak duży, że uzyskanie w końcu obrazu, którego szukamy, może wymagać kilku prób; Ponieważ jednak korzystanie z tej usługi jest całkowicie bezpłatne, warto poświęcić trochę cierpliwości i wysiłku, aby zaspokoić naszą ciekawość.
Żądany obraz: Młody mężczyzna otwierający portal do starożytnego Rzymu za pomocą Commodore 64
W Dall-E Mini wszystko można sobie wyobrazić; Nawiasem mówiąc, internauci są tak zafascynowani tą usługą ze względu na jej zdolność do wychwytywania najdziwniejszych i najbardziej nieistotnych żądań oraz absurdalnych sytuacji, co prowadzi do zabawnych, a czasem zaskakujących wyników.
Po wpisaniu żądanej frazy w polu tekstowym Dall-E Mini i naciśnięciu przycisku Uruchom zostanie wyświetlonych dziewięć obrazów o wymiarach 256 na 256 pikseli, które odpowiadają algorytmowi używanemu na tej platformie.
Oczywiście, jeśli przyjrzysz się uważnie tym zdjęciom, zdasz sobie sprawę, jak bardzo są one wadliwe, zwłaszcza jeśli wpiszesz imiona prawdziwych ludzi zamiast wyimaginowanych zwierząt lub postaci. Jednak z daleka i na pierwszy rzut oka powstałe obrazy są często bardzo podobne do tego, czego się spodziewamy.
Dima przyznaje, że platforma osiąga lepsze wyniki w przypadku obrazów abstrakcyjnych, ale ma trudności z bardziej szczegółowymi, autentycznymi obrazami.
Bez wątpienia najtrudniejszą częścią są zdjęcia ludzi. Jeśli poprosisz Dall-E o scenę, wynik będzie świetny; Bo jeśli drzewo ma problem, nikt tego nie zauważy. Jeśli jednak część twarzy danej osoby, na przykład oko, ma problem, natychmiast go zauważymy.
Chociaż Dall-E Mini może tworzyć piękne, „artystyczne” obrazy, matematyka i algorytmy są tu stosowane bez artystycznego gustu. To, co robi sztuczna inteligencja tej platformy, nie wyraża jej artystycznego gustu.
Niestety lub na szczęście sztuczna inteligencja nie rozwinęła się jeszcze na tyle, aby być kreatywną; Zamiast tego algorytm Dall-E Mini przegląda tylko niezliczone obrazy w Internecie, które dopasowują tekst do żądania użytkownika, a następnie znajduje wzorce powtarzające się w większości z nich, takie jak kształty, kolory i opisy.
Następnie Dall-E Mini używa tych szablonów, aby dowiedzieć się, jak utworzyć obraz pasujący do żądania tekstowego użytkownika.
Żądany obraz: Obcy stwór kosmiczny z filmu w stylu przedprojektowym sali sądowej
Dima opisuje Dall-E Mini jako imitację OpenAI DALL-E projektu, ale na znacznie mniejszą skalę, z prostszą architekturą niż wersja pierwotna, która choć znacznie gorsza jakość niż DALL-E, jest całkowicie darmowa do wdrożenia dla wszystkich. Nie ma potrzeby stosowania takiego sprzętu; Dall-E Mini możesz nawet wypróbować na swoim smartfonie, choć producent twierdzi, że w sieci działa lepiej.
Co ciekawe, modele uczenia maszynowego używane do konwersji tekstu na obraz osiągnęły taki poziom możliwości Dall-E Mini dopiero w ciągu kilku lat. Na przykład w tym artykuł, który ukazał się w 2018 roku, widać wyzwania i słabości starszych modeli. Biorąc pod uwagę ” stado żyraf na statku – podpis, ten model potrafił stworzyć jedynie kilka kształtów przypominających żyrafę stojących na wodzie.
Ten model nie wymyślił nawet prostego ” owce ” wniosek. Fakt, że obecnie możemy uzyskać tak niemal realistyczne wyniki z małego, własnego projektu przeznaczonego wyłącznie na konkurs, wskazuje na znaczną poprawę „zrozumienia” algorytmów.
Dall-E; Wielka rewolucyjna iskra w tworzeniu dzieł sztuki?
Dall-E Mini to nic innego jak maluch w porównaniu ze swoją pierwotną wersją, DALL-E, a dokładniej DALL-E 2; Niestety główny projekt znajduje się obecnie w fazie prywatnej bety, a dostęp do niego ma niecałe 5 tysięcy osób.
Usługa DALL-E, nazwana na cześć połączenia Salvadora Dali, malarza surrealisty i animatora Pixar WALL-E, narodziła się w styczniu 2021 roku w firmie OpenAI z siedzibą w San Francisco. OpenAI zostało założone w 2015 roku przez Ilana Maska, Sama Altmana, Ilyę Softcore i trzech innych, ale Musk opuścił zarząd w 2018 roku. W 2019 roku Microsoft zainwestował w firmę 1 miliard dolarów.
OpenAI jest znane z opracowania GPT-3, narzędzia do generowania złożonego i ciężkiego tekstu z prostych wyrażeń, oraz Copilot, narzędzia do automatyzacji procesu kodowania dla inżynierów oprogramowania. Ich kod open source jest dostępny do użytku publicznego w GitHub.
Dzięki technologii Dall-E nie musisz już posiadać zaawansowanych umiejętności obsługi Photoshopa.
Pierwsza wersja DALL-E również bazowała na modelu GPT-3 i ograniczała się do tworzenia obrazów w rozdzielczości 256 na 256 pikseli. Jednak druga wersja, która w kwietniu 2022 r. weszła w fazę prywatnej wersji beta, stanowi znaczący krok naprzód w zakresie generatorów obrazów opartych na sztucznej inteligencji.
Obrazy, które DALL-E 2 jest w stanie utworzyć, mają teraz wymiary 1024 na 1024 pikseli i wykorzystują nowe techniki, takie jak „inpainting”, w którym wybrane przez użytkownika elementy pomysłu są zastępowane innym obrazem; Załóżmy na przykład, że robisz zdjęcie pomarańczy w pojemniku, a następnie mówisz DALL-E, aby zastąpił je obrazem jabłka, a DALL-E zrobi to w możliwie najczystszy sposób. Dlatego nie potrzebujesz już zaawansowanych umiejętności Photoshopa!
Oprócz możliwości edycji i retuszu zdjęć, druga wersja DALL-E potrafi zamienić proste opisy tekstowe takie jak „ Spotkanie herbaciane ze słoniem na trawie ”, które wcześniej nie istniały w artystycznych lub autentycznych obrazach, które będziesz zaskoczony.
Magia DALL-E nie polega tylko na indywidualnym rozpoznawaniu obiektów, ale także na unikalnym rozumieniu relacji między obiektami, dzięki czemu kiedy poprosisz je o utworzenie „ astronauta jeździecki, ” oni wiedzą, co przez to rozumiesz. . W tym ćwierkać, możesz zobaczyć niektóre obrazy utworzone za pomocą DALL-E.
Żądany obraz: Robotyczny dinozaur kontra potwory w ciężarówkach w Koloseum
OpenAI opisuje projekt DALL-E jako przykład współpracy kreatywnych ludzi i inteligentnych systemów w celu wizualizacji nowych pomysłów i zwiększania ludzkiej kreatywności.
Firma dodaje również, że obrazy utworzone za pomocą DALL-E mogą nam powiedzieć, czy system rozumie, co mówimy my, ludzie, czy też powtarza to, czego się nauczył. Ponadto DALL-E pokazuje nam, jak systemy AI postrzegają nasz świat i wiedzą, że według OpenAI ma to kluczowe znaczenie dla rozwoju praktycznej i bezpiecznej sztucznej inteligencji.
Najważniejszą rzeczą, którą należy wiedzieć o DALL-E, jest to, że jego twórca uważa, aby nie używać go w niewłaściwy sposób. Użytkownicy zaproszeni do korzystania z tej platformy po założeniu konta muszą zaakceptować politykę treści tej firmy.
Na przykład DALL-E nie pozwala użytkownikowi na używanie mowy nienawiści, przemocy, nagości, niemoralności lub jakichkolwiek treści politycznych. Platforma wykorzystuje także metody zapobiegające tworzeniu realistycznych obrazów twarzy prawdziwych ludzi, w tym celebrytów.
OpenAI ma rygorystyczne zasady zapobiegające niewłaściwemu wykorzystaniu Dall-E.
Choć w DALL-E możliwe jest tworzenie obrazów na podstawie twarzy gwiazd, nie ma możliwości przesłania zdjęcia bez ich zgody, a platforma wykorzystuje takie metody, jak rozmycie przodu, aby zapobiec tworzeniu realistycznych obrazów jasne, że obrazy są zmanipulowane i niedokładne. DALL-E ma również dostęp do listy zabronionych słów, takich jak „strzelanie”, aby zapobiec zawieraniu wrażliwych treści na zdjęciach. Użytkownikom nie wolno również wykorzystywać tej platformy do tworzenia obrazów mających na celu oszukanie, np. Deepfake.
Praca z DALL-E jest tak prosta, jak wpisanie frazy w polu tekstowym; Wygląda na to, że pasek wyszukiwania Google został przekonwertowany na Photoshop. Platforma, nawet zainspirowana Google, ma przycisk „zaskocz mnie”, który wstawia frazy oparte na wcześniej utworzonych obrazach w wybranym przez siebie polu tekstowym. Przycisk ten przydaje się, gdy użytkownik szuka nowego pomysłu na stworzenie dzieła sztuki, ale nic nie przychodzi mu do głowy.
Utworzenie dziesięciu powiązanych obrazów proporcjonalnie do wpisanej frazy zajmuje DALL-E około 15 sekund; Oczywiście od niedawna ilość zdjęć na jedno żądanie została zmniejszona do 6, aby więcej osób mogło korzystać z tej platformy.
Zdjęcie DALL-E przedstawiające „krzesło z awokado”.
Jedną z wiodących technologii stosowanych w tej platformie jest „dyfuzja”, co zostało wyjaśnione przez Jednostka sztucznej inteligencji Google w zeszłym roku. Ogólnie rzecz biorąc, modele oparte na dyfuzji degradują dane wprowadzane do sieci w celu uczenia syntetycznej inteligencji, dodając szum Gaussa i delikatnie usuwając szczegóły danych, tak że pozostaje tylko czysty szum.
Następnie inna sieć neuronowa przeprowadza proces degradacji danych w odwrotnym kierunku, tak że cały szum zostaje usunięty i powstaje próbka całkowicie wolna od szumów.
Pomijając te wszystkie wyjaśnienia, zdumiewająca jest niesamowita kreatywność tej technologii w produkcji obrazu. Rozważmy na przykład następujące obrazy utworzone na podstawie tych wyrażeń:
Niedźwiedź ekonomista kontra trend spadkowy na giełdzie, sztuka cyfrowa
Ekonomista byk kontra wykres giełdowy, sztuka cyfrowa
Moc DALL-E w zakresie uchwycenia emocji w tych dwóch przypadkach jest naprawdę wyjątkowa; Znoś strach i bezradność w obliczu krowiego gniewu. Jednakże obrazy te wywołują u widza wrażenie, że patrzymy na dzieło sztuki i kreatywność. Jednak używanie słowa „twórczy” do opisania tego procesu jest błędne, ponieważ to, co się dzieje, opiera się na domysłach i prawdopodobieństwie, a nie na artystycznym guście.
Kolejną ekscytującą cechą DALL-E jest jego zdolność do rozwiązywania problemów na różne sposoby. Na przykład, gdy poproszono o pokazanie „Pyszny cukierek cynamonowy z ruchomymi oczami lalki” – próbował na różne sposoby zilustrować ten model oczu, a jednym z nich był zabawny miniaturowy cukierek cynamonowy.
Można śmiało powiedzieć, że DALL-E jest najbardziej zaawansowanym narzędziem do generowania obrazu, ale podobnych przykładów jest wiele.
Google wprowadziło także narzędzie Imagen, z którego użytkownicy publiczni nie mogą jeszcze korzystać. I oczywiście Dall-E Mini, który nie ma nic wspólnego z oryginalnym DALL-E, ale w przeciwieństwie do innych narzędzi, stał się powszechnie dostępny i niezwykle popularny.
OpenAI nie zdecydowało jeszcze, czy pewnego dnia udostępnić publicznie DALL-E. Zdaniem firmy celem obecnego projektu jest pokazanie kilku osobom, jak pracować z technologią i, jeśli zajdzie taka potrzeba, aktualizacja zarówno platformy, jak i polityki treści na podstawie otrzymanych informacji zwrotnych.
Chociaż DALL-E jest prawdopodobnie najbardziej zaawansowanym jak dotąd narzędziem do generowania obrazu, chociaż nie jest jeszcze powszechnie dostępne, możesz bawić się podobnymi przykładami, takimi jak Dall-E Mini i kilkoma innymi wymienionymi poniżej.
Platformy sztucznej inteligencji podobne do DALL-E
Oprócz Dall-E Mini, który tak uzależnił internautów, dostępne są inne egzemplarze, które robią mniej więcej to samo. Platformy takie jak StarryAI i NightCafe działają bardzo podobnie do DALL-E, z tą różnicą, że wszystkie tworzone obrazy są całkowicie nierealistyczne i artystyczne i nikt nie może pomylić ich ze zdjęciem. Na przykład NightCafe generuje marzycielskie obrazy na podstawie wpisywanych fraz i oferuje różne style, takie jak „cyberpunk” czy „fantasy”.
Twórca dzieł sztuki AI, który według witryny „przemienia wyobraźnię w sztukę”, obejmuje różne opcje, w tym anime, akwarelę i realistyczny obraz, który wyświetla tylko jeden obraz o wymiarach 256 na 256 pikseli na żądanie, ale za darmo. Aby uzyskać bardziej znaczące wymiary, trzeba zapłacić. Ponadto na tej platformie istnieje możliwość konwersji utworzonej grafiki do formatu NFT.
Obrazy utworzone w AI Art Maker na podstawie żądania tekstowego „Handy Ice Cream Cat” w czterech różnych stylach
Sen autorstwa WOMBO aplikacja, która ma również wersję internetową, podobnie jak NightCafe, oferuje różnorodne style artystyczne, dzięki czemu efekt końcowy będzie wyglądał jak dzieło sztuki. Ta aplikacja opiera się na dwóch sieciach neuronowych, VQGAN i CLIP; pierwszym zadaniem jest stworzenie obrazów podobnych do innych zdjęć. CLIP jest przeszkolony w określaniu stosowności opisów tekstowych ze zdjęciami.
Obrazy utworzone przez Google Imagen
GauGAN2 firmy Nvidia projekt, o którym mówiliśmy w zeszłym roku, może, dzięki dogłębnej nauce, tworzyć obrazy wpisanych na maszynie słów i wyrażeń, które czasami są bardzo podobne do wyrażeń pisanych na maszynie, a czasem są artystyczne, a czasem przerażające. Algorytm GauGAN2 jest trenowany na podstawie 10 milionów obrazów krajobrazu za pomocą superkomputera Celine Nvidia, jednego z dziesięciu najpotężniejszych superkomputerów na świecie. W najlepszym razie może tworzyć bardzo realistyczne obrazy. Chociaż ten projekt jest wciąż w fazie beta, możesz wypróbować go bezpłatnie.
Google pracuje również nad podobną wersją Dall-E o nazwie Obraz, który wykorzystuje modele OpenAI do generowania obrazów o wyższej jakości. Niestety Google nie ma wersji demonstracyjnej Imagen, z którą można by współpracować, podobnie jak Dall-E Mini. Mimo to możesz zobaczyć kilka przykładów obrazów wykonanych za pomocą silnika Imagen powyżej oraz na oficjalnej stronie tego projektu.
DALL-E; Strach i uśmiech
W świecie technologii pojawienie się zjawiska takiego jak DALL-E, będącego niezwykłym pokazem potęgi i zaawansowania sztucznej inteligencji, mogłoby być punktem wyjścia do rewolucji w wielkości i wpływie Internetu i smartfonów. Chociaż OpenAI nie zidentyfikowało jeszcze możliwych zastosowań tej technologii, osoby, które miały okazję jej doświadczyć, odkryły kilka ekscytujących zastosowań.
Na przykład artysta wykorzystał DALL-E do zaprojektowania filtrów rzeczywistości rozszerzonej dla aplikacji w sieciach społecznościowych; Albo kucharz bierze pomysł od DALL-E, aby udekorować swoje jedzenie. W artykule na temat potencjalnych możliwości DALL-E Ben Thompsonanalityk techniczny, wskazuje na tworzenie środowisk i obiektów cyfrowych w Metavarach w bardzo niedrogi sposób.
Narzędzia takie jak DALL-E mogą być pomocne dla grafików; Na przykład mogą poprosić DALL-E o opracowanie kilku pomysłów koncepcyjnych, zanim sami to zrobią. Platforma ta może być korzystna także dla osób, które nie mają możliwości finansowych na zatrudnienie projektanta.
Być może chciałeś narysować swój komiks jako dziecko, ale pomysł nigdy się nie zmaterializował, ponieważ twoje umiejętności rysowania nie były dobre.
Niektórzy miłośnicy sztucznej inteligencji odkryli także inne ekscytujące zastosowanie dla DALL-E; Ci ludzie podeszli do klasycznych dzieł sztuki i poprosili sztuczną inteligencję o namalowanie kontynuacji tych dzieł lub wyobrażenie sobie ich na nowo w zupełnie innych stylach.
A Użytkownik Reddita z DALL-E próbował zakończyć W połowie ukończony rysunek Jerzego Waszyngtona przez Gilberta Stewarta w 1996 r., z następującym wynikiem:
DALL-E nie wydaje się być narzędziem, z którego większość ludzi chce korzystać codziennie. Można jednak sobie wyobrazić, że w nadchodzących miesiącach i latach w handlu elektronicznym, sieciach społecznościowych, domu i pracy odkryte zostaną inne kreatywne zastosowania tej technologii.
Często jest tak, że wraz z pojawieniem się nowej technologii cała nasza uwaga skupia się na jej pozytywnych aspektach i zastosowaniach, ignorując ewentualne jej nadużycia w przyszłości; Jednak choć jesteśmy podekscytowani pojawieniem się technologii DALL-E, obawialiśmy się niewłaściwego wykorzystania takiego narzędzia w rękach osób i firm, które mają mniej zasad i czerwonych linii niż OpenAI.
Firma taka jak OpenAI może mieć rygorystyczne zasady przeciwdziałające nadużyciom DALL-E. Mimo to można spodziewać się złośliwych aplikacji wraz z pojawieniem się nowych i podobnych narzędzi, takich jak Dall-E Mini, które nie zapewniają poważnego monitorowania zawartości.
Nawet teraz niektórzy ludzie wykorzystują technologię nękania, aby nękać innych; Jest mało prawdopodobne, że ludzie będą chcieli używać platformy takiej jak DALL-E do szkodliwych celów.
Użyj Dall-E, aby rozszerzyć klasyczną grafikę.
Z drugiej strony proces automatyzacji zawsze wiązał się z obawą o utratę pracy. Teraz, gdy sztuczna inteligencja może namalować wszystko, co tylko możemy sobie wyobrazić, po co nam profesjonalni ilustratorzy? Jeden z ci sami artyści napisał na Twitterze o swoich obawach w związku z tą sytuacją:
Mam straszne przeczucie, że sztuka oparta na sztucznej inteligencji połknie profesjonalną stabilność ekonomiczną ilustracji. Nie dlatego, że sztukę ma całkowicie zastąpić sztuczna inteligencja, ale dlatego, że ten model sztuki będzie znacznie tańszy i bardziej odpowiedni dla większości osób i organizacji.
Łatwo powiedzieć: „Do prawdziwych artystów chodzę tylko ze względu na sztukę”. Ale poczekaj, aż będziesz musiał wybrać między zapłaceniem 500 dolarów a zerem za system, który może wykonać do 95% Twojej pracy.
Kolejnym problemem modeli AI, których sieci neuronowe są szkolone na podstawie danych pochodzących z Internetu, jest kwestia dyskryminacji i obraźliwych treści. Kilka lat temu grupa badaczy z MIT usunęła ogromną kolekcję 80 milionów obrazów używanych do nauczania ich algorytmów, ponieważ zawierały „obraźliwe terminy i obrazy”.
Również w większości tych modeli, jeśli używasz słów związanych z biznesem, większość zdjęć przedstawia mężczyzn, co wskazuje na dyskryminację kobiet.
Z drugiej strony pozytywne aspekty tej technologii należy rozważyć w szerszej skali. Co dzieje się z naszym rozumieniem rzeczywistości, gdy większość obrazów, które spotykamy w Internecie, jest tworzona przez sztuczną inteligencję? Jak odróżnić rzeczywistość od sztucznej inteligencji?
DALL-E wydaje się być kluczowym narzędziem w świecie technologii konsumenckiej. Czy naszym zdaniem DALL-E pozostanie przez kilka kolejnych lat zdumiewającym rewolucjonistą w sztuce i kreatywności, czy też zapoczątkuje przygodę o bardziej niepokojącym wymiarze?
Pobieranie premium motywów WordPressPobieranie premium motywów WordPressPobierz bezpłatne motywy WordPress PremiumPobierz zerowe motywy WordPressudemy do pobrania za darmopobierz oprogramowanie SamsungaPobierz motywy WordPressdarmowy kurs Udemy do pobrania