Technologiczne, Gadżety, Telefony Komórkowe, Pobieranie Aplikacji!

Google ogłasza Gemini, swój model sztucznej inteligencji, który może przewyższyć ChatGPT

W środę (6) firma Google ogłosiła swój najnowszy postęp w dziedzinie sztucznej inteligencji (AI). Nowy wielomodalny model wielojęzyczny (LLM), nazwany Gemini, według firmy jest w stanie przewyższyć GPT-4z OpenAI, używany w popularnym chatbocie ChatGPT.

Nowy model potrafi „rozumieć, obsługiwać i łączyć różne rodzaje informacji” w oparciu o tekst, dźwięk, obraz, wideo i języki programowania. Według Demisa Hassabisa, dyrektora generalnego i współzałożyciela Google DeepMind, Gemini powstało tak, aby nie przypominało „inteligentnego oprogramowania, a bardziej czegoś przydatnego i intuicyjnego”.

Firma podkreśla także, że Gemini to najbardziej elastyczny model stworzony przez nią do tej pory. Można go udostępnić np. zarówno w centrach danych, jak i na urządzeniach mobilnych, takich jak telefony komórkowe. Obecnie w modelu Gemini 1.0 będzie dystrybuowany w trzech różnych rozmiarach:

  • Bliźnięta Ultra: największy model i zdolny do obsługi „bardzo złożonych zadań”;

  • Bliźnięta Pro: idealny model do skalowania dużego zestawu zadań;

  • Bliźnięta Nano: mniejsza i wydajniejsza wersja do działań prowadzonych bezpośrednio na urządzeniach takich jak telefony komórkowe.

Z Gemini można teraz korzystać w Google Bard w 170 krajach (w tym w Brazylii), ale tylko w języku angielskim. W 2024 r. najpotężniejszy model zostanie włączony do chatbota, a „wkrótce” ma zostać włączonych także więcej języków.

Dotarł także do Google Pixel 8 Pro i w przyszłości będzie dostępny bezpośrednio w wyszukiwarce Google, Chrome oraz innych usługach i produktach firmy. Na firmowym telefonie komórkowym Gemini Nano może wykonywać zadania w aplikacji do nagrywania dźwięku, podsumowywania plików, a także w funkcji Smart Reply Gboard na WhatsApp.

Gemini Ultra, którego premiera nastąpi w przyszłym roku, będzie początkowo dostępna dla wybranych klientów, programistów, partnerów oraz ekspertów ds. bezpieczeństwa i odpowiedzialności, zanim dotrze do innych. Ideą jest zbieranie opinii i wprowadzanie poprawek do produktu.

Co potrafi Google Gemini

Google wyjaśnia, że ​​Gemini został zaprojektowany tak, aby był natywnie multimodalny, co może pomóc „płynnie zrozumieć i przemyśleć wszystkie rodzaje informacji od samego początku”.

Może na przykład wydobywać spostrzeżenia „z setek tysięcy dokumentów” – cytuje firma, mieszając czytanie, filtrowanie i rozumienie informacji w celu dostarczenia informacji z różnych dziedzin.

Mało tego, nową funkcją modelu jest umiejętność jednoczesnego rozpoznawania i rozumienia tekstów, obrazów, plików audio i innych. W ten sposób może uzyskać bardziej kontekstowe odpowiedzi na bardziej złożone pytania.

Bardziej niezawodny niż ChatGPT?

Według Google Gemini pomyślnie przeszło 30 z 32 akademickich testów porównawczych wykorzystywanych w badaniach i rozwoju dużych modeli językowych. Wersja Ultra, z wynikiem 90%, byłaby pierwszym modelem, który osiągnąłby lepsze wyniki niż eksperci w dziedzinie MMLU (massive multitask Language Understanding). Wśród kryteriów znajdują się matematyka, fizyka, historia, prawo, medycyna i etyka.

Propozycja, gwarantuje firma, jest taka, że ​​Gemini może „dokładniej przemyśleć, zanim odpowie na trudne pytania”.

Google ogłasza Gemini, swój model sztucznej inteligencji, który może przewyższyć ChatGPT

Google ogłasza Gemini, swój model sztucznej inteligencji, który może przewyższyć ChatGPT

Według porównania opublikowanego przez firmę, w stosunku do GPT-4, Gemini Ultra przewyższa model OpenAI pod względem możliwości tekstowych, wnioskowania, matematyki i programowania. W testach multimodalnych nowe narzędzie okazało się również bardziej niezawodne w testach obejmujących obrazy, wideo i dźwięk.