Weszła Aleksa w świat generatywnej sztucznej inteligencji (AI) i teraz „mówi jak człowiek”. Wiadomość została udostępniona w środę (20) podczas globalnego wydarzenia dotyczącego urządzeń Amazon.
Dave Limp, starszy wiceprezes ds. urządzeń i usług w Amazon, wyjaśnia, że „generatywna sztuczna inteligencja skupia się na twórcach, a nie konsumentach”, więc aktualizacja wiąże się z dużymi oczekiwaniami.
Propozycja jest prosta: Rozpoczynasz rozmowę z Alexą, a ona reaguje szybciej i bardziej naturalnie. Model językowy Amazona opiera się na technologii Speech-to-Speech. Dzięki niemu Alexa musi także uczyć się bezpośrednio na podstawie rozmów i interakcji poszczególnych użytkowników.
Ten wspaniały nowy model językowy (LLM), wyposażony w funkcję o nazwie „Alexa, porozmawiajmy”, ujednolica interakcję zamiany tekstu na mowę, która następnie „tłumaczy” odpowiedzi na dźwięk, wyjaśnia Rohit Prasad, wiceprezes i dyrektor nauki w Amazon Artificial General Intelligence.
Dzięki aktualizacji Alexa powinna także brzmieć bardziej ludzko w Twoich interakcjach. Na przykład asystent może się śmiać, sprawiać wrażenie zaskoczonego, a nawet robić w trakcie rozmowy pauzy z „um…”.
Cechą wykazaną przez firmę jest właśnie zdolność „nowej Alexy” do kontynuowania rozmów w bardziej praktyczny sposób. Będzie można rozpocząć rozmowę, a nawet przerwać ją na chwilę, dopóki nie wrócisz do tego samego tematu. Możesz także przerwać odpowiedź, aby dodać więcej kontekstu lub poprosić o coś dodatkowego podczas interakcji.
Propozycja zakłada uniemożliwienie użytkownikowi ciągłego powtarzania słowa aktywującego „Alexa”, gdy chce porozmawiać z asystentem. W tym celu dostępna jest nowa funkcja powiązana z Visual ID, która pozwala rozpocząć rozmowę po prostu zbliżając się do ekranu, ponieważ rozpoznaje on twarze. Funkcja jest kompatybilna tylko z modelami wyposażonymi w ekran i aparat.
Alexa bardziej osobista
Alexa oparta na nowym modelu językowym będzie dostępna dla wszystkich modeli Echo, w tym pierwszego, wprowadzonego na rynek w 2014 roku. Początkowo będzie ona jednak dostępna wyłącznie dla użytkowników w Stanach Zjednoczonych. Prasad wyjaśnia, że w nowych modelach należy ułatwić interakcję, biorąc pod uwagę, że przetwarzanie danych odbywa się na samych urządzeniach. Jest jednak również oparty na chmurze, więc można go używać w poprzednich wersjach.
„Nasz nowy model [de linguagem] jest specjalnie zoptymalizowany pod kątem komunikacji głosowej i rzeczy, które, jak wiemy, uwielbiają nasi klienci — takich jak dostęp do informacji w czasie rzeczywistym, efektywne sterowanie inteligentnym domem i maksymalne wykorzystanie domowej rozrywki” – mówi Limp.
Jeśli chodzi o ogłoszenie, Limp podkreśla, że firma zbudowała „nową Alexę”, mając na uwadze pięć podstawowych zasad:
-
Rozmowa: w oparciu o słowa, mowę ciała, kontakt wzrokowy, gesty i tym podobne;
-
Aplikacje w świecie rzeczywistym: przybliżanie LLM użytkownikom „w prawdziwym świecie, a nie w zakładce przeglądarki [de internet]”;
-
Personalizacja: aby rozmowy były specyficzne dla różnych użytkowników, np. rodzin;
-
Osobowość: Firma obiecuje, że Alexa oparta na nowym LLM „będzie miała opinie”;
-
Niezawodność: aby chronić prywatność użytkowników i rodzin oraz dostarczać wysokiej jakości informacje.
Alexa może być również eksplorowana przez programistów, którzy będą mogli używać i integrować jej interfejsy API z LLM. Według firmy adaptacja nie wymaga kodu i powinna być „prosta i szybka”. Ta nowa funkcja będzie dostępna od przyszłego roku.
Echo Show 5 (3. generacja)
Widżet produktu z Centrum ofert