CzatGPT teraz oferuje interakcję głosową lub obrazową. W ten poniedziałek (25) OpenAI ogłosiło, że chatbot potrafi przełożyć wypowiedzi na tekst.
Proces interakcji jest bardzo podobny do tradycyjnego czatu, z tą różnicą, że zamiast pisać, użytkownik musi mówić. Wystarczy dotknąć przycisku nagrywania, aby wypowiedzieć pytanie lub przeprowadzić interakcję. Następnie ChatGPT przekonwertuje go na tekst i wyśle do szablonu.
Użyj swojego głosu, aby nawiązać konwersację z ChatGPT. Porozmawiaj z nim w drodze, poproś o bajkę na dobranoc lub rozstrzygnij debatę przy stole.
Dźwięk włączony? pic.twitter.com/3tuWzX0wtS
— OpenAI (@OpenAI) 25 września 2024 r
Technologia stojąca za narzędziem to Whisper, model sztucznej inteligencji (AI) zdolny do dostosowywania mowy mówionej do tekstu. Podobnie jak wirtualni asystenci, ChatGPT będzie także mógł odpowiadać za pomocą głosu syntetycznego.
Zdaniem OpenAI jest to możliwe dzięki nowemu modelowi sztucznej inteligencji przetwarzającej tekst na mowę. Dostępność modelu zdolnego do głośnego reagowania będzie ograniczona.
Interpretacja obrazu
Kolejną nową funkcją jest interakcja obrazu. Funkcja jest bardzo podobna do Google Lens, potrafi rozpoznać elementy postaci lub zdjęcia w celu przeszukania sieci.
ChatGPT może teraz widzieć, słyszeć i mówić. W ciągu najbliższych dwóch tygodni użytkownicy Plusa będą mogli prowadzić rozmowy głosowe za pomocą ChatGPT (iOS i Android) oraz dołączać obrazy do rozmów (na wszystkich platformach). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) 25 września 2024 r
Podczas przesyłania pliku ChatGPT spróbuje wywnioskować, o czym użytkownik chce rozmawiać i odpowiednio zareagować. Możliwe będzie także skorzystanie z narzędzia edycyjnego, aby wskazać, co ma zostać zidentyfikowane przez sztuczną inteligencję, wypowiedzieć lub wpisać pytanie w celu uzupełnienia interakcji.
W pewnym sensie funkcja ta wykracza poza Google Lens, bo nie jest to proste wyszukiwanie w Internecie. Wszechstronność sztucznej inteligencji OpenAI zapewnia bardziej naturalną interakcję, jak gdyby była to rozmowa z drugą osobą.
Ze względów bezpieczeństwa ChatGPT nie będzie w stanie rozpoznawać ludzi. OpenAI twierdzi, że rozwiązanie to jest sposobem na ochronę prywatności społeczeństwa. Bez tego każdy mógłby wysłać modelowi zdjęcie i zapytać „kto to jest?” uzyskać odpowiedź np.
Początkowo oba nowe będzie dostępny tylko dla abonentów ChatGPT. Według OpenAI pozostali użytkownicy otrzymają tę wiadomość „wkrótce potem”.
—
Kurs ChatGPT
Widżet produktu z Centrum ofert