Mówienie do maszyn przynosi możliwości i wyzwania

Guardian Voice Lab dzieli się swoimi spostrzeżeniami na temat tego, w jaki sposób wydawcy wiadomości mogą opracowywać strategie za pomocą głosu.

W ciągu ostatnich sześciu miesięcy Voice Lab zbadał wyzwania i możliwości pojawiające się dla wydawców wiadomości dzięki inteligentnym urządzeniom z obsługą głosu. Podeszliśmy do tego problemu poprzez eksperymentowanie i praktyczne uczenie się informowania zespołu strategicznego Guardiana o głosie i przyszłości dźwięku.

Projekt miał być ograniczony, aw tym tygodniu kończymy aktywną pracę w laboratorium. Zanim zamkniemy ten rozdział, oto kilka z naszych kluczowych ustaleń.

Charakterystyczny nowy nośnik

Inteligentne głośniki są katalizatorem destrukcyjnej transformacji sposobu, w jaki zajmujemy się maszynami. Ale obecna generacja urządzeń reprezentuje punkt wejścia, a nie koniec.

Technologia napędzająca tę rewolucję zapewnia naturalny język dostępu do szeregu usług dostępnych dzięki sztucznej inteligencji. Począwszy od przesyłania strumieniowego na żądanie mediów, a skończywszy na nowych, interaktywnych modelach, projektowanie dla głosu wymaga nowatorskiego podejścia do budowania znaczących doświadczeń z treścią.

Niezbędne będzie zgromadzenie zespołów z różnych dyscyplin, które są gotowe do przemyślenia i ponownego uczenia się, jak podejść do rozwiązywania problemów. To była ekscytująca i rzadka okazja, aby znaleźć się w związku z procesem tworzenia treści i metodologią rozwoju produktu.

Audio-centric, nie tylko audio

Dostęp do asystentów cyfrowych rozprzestrzenia się na coraz większą różnorodność czynników kształtujących o różnych możliwościach powierzchniowych. Dzięki kategoriom urządzeń, od słuchawek po samochody, budowanie dla przyszłości głosu będzie wymagało elastycznego podejścia.

Niewątpliwie najbardziej podstawową odpowiedzią na każde wejście głosowe jest odpowiedź dźwiękiem. Tworzenie wysokiej jakości dźwięku ma potencjał, aby stać się wyróżnikiem w obszarze pozbawionym wielu tradycyjnych elementów wizualnych. Chociaż dźwięk może być domyślny, nie jest to jedyne możliwe wyjście.

W ten sam sposób responsywny projekt wpłynął na proces budowania sieci, tworzenie rozwiązań dla głosu wymaga podobnego zestawu zasad. Inwestowanie w ustrukturyzowane i elastyczne treści przyniesie korzyści przy adaptacji do nowych możliwości powierzchniowych i szybko zmieniających się oczekiwań użytkowników.

Perspektywa tworzenia bezproblemowych interakcji multimodalnych między urządzeniami dawała poczucie sfery science fiction. Dzięki platformom inteligentnego asystenta, wykorzystując zarówno wizualne, jak i dźwiękowe metody, ponieważ wejścia i wyjścia stają się ekscytującą rzeczywistością.

Wzorce treści wschodzących

Zwyczaje dotyczące inteligentnych głośników zbiegają się w szczególności wokół dwóch różnych rodzajów doświadczeń; krótki i transakcyjny vs długi i ambientowy.

Z jednej strony spektrum, zapotrzebowanie na zwięzłe rozwiązania codziennych potrzeb jest jasne. Użytkownicy chętnie otrzymują streszczenia wiadomości, aktualizacje pogody, a nawet zamówią taksówkę na żądanie. Koniec interakcji polega na wypełnieniu prostej prośby poprzez dostarczenie czegoś konkretnego i skończonego. Nasz projekt Guardian Briefing był próbą dopasowania tej formy.

I odwrotnie, długie sesje muzyczne i strumienie radiowe wypełniają tło nieokreślonym dźwiękiem jako towarzyszem typowych czynności domowych. Łatwe do zażądania i łatwe do sterowania, te liniowe doznania zapewniają inny rodzaj wartości. Bardziej przyszłościowe formaty wykorzystają interoperacyjność dźwięku na inteligentnych urządzeniach, aby dodać warstwy kontroli i personalizacji.

W szczególności podcasty nie znalazły jeszcze znaczącej publiczności na tej platformie. Być może żyją na środku między krótką i długą formą, a może są wyzwani przez jakiś inny problem strukturalny.

Jedna z teorii mówi, że podcasting wymaga zbyt dużej, specyficznej wiedzy, aby móc się o nią ubiegać w porównaniu ze względną łatwością proszenia o transmisję strumieniową lub radia z muzyką. Obecny model opiera się na agregowaniu kanałów na urządzeniu mobilnym, wybieraniu spośród wielu ostatnich odcinków a la carte, a następnie słuchaniu w ustalonych przyrostach w ciągu dnia, takich jak dojazdy do pracy lub prace domowe. Wielu z nas mogło zacząć prosić o podcast od Asystenta, zanim zdążyliśmy się zorientować, że brakuje nam dokładnego słownictwa, aby uzyskać to, czego chcemy.

Wiele osób pracuje nad nowymi formatami i mechanizmami odkrywania podcastów, aby pomóc w rozwiązaniu tych problemów, ale do tego czasu inteligentne głośniki prawdopodobnie będą odpowiadać za niewielką ilość słuchania.

Horyzonty do wyszukiwania

Voice ma potencjał, aby stać się dominującą drogą wyszukiwania. Prognozy potwierdzają do 2020 r. Połowa wszystkich wyszukiwań zostanie przeprowadzona za pomocą dyktowania, a 30% wszystkich zapytań zostanie przeprowadzonych bez ekranu. Zadawanie pytań dotyczących wiedzy ogólnej jest już konsekwentnie klasyfikowane jako jeden z podstawowych przypadków użycia.

Charakter medium stanowi wyzwanie dla modeli biznesowych opartych głównie na przeglądaniu stron. Media informacyjne i platformy muszą współpracować, aby lepiej zrozumieć i ocenić to zachowanie. Wyjaśnienie naszego szybko zmieniającego się świata dzięki odpowiedziom opartym na raportowaniu jest jedną z podstawowych wartości, którą zapewniają wydawcy. Specjalnie dla twórców treści, których głównym medium jest tekst, eksplorowanie formatów takich jak talkables w połączeniu ze strukturalnymi systemami treści może przynieść korzyści, ponieważ większa część naszych odbiorców polega na głosie.

Więcej niż tylko szum

Prawdopodobnie jeszcze nie osiągnęliśmy „szczytowego szumu” wokół głosu. Inteligentne urządzenia sprzedają się szybciej niż telefony komórkowe 10 lat temu, ale prawdopodobnie trend ten ustabilizuje się w pewnym momencie, osiągając punkt nasycenia podobny do tego, który zaobserwowaliśmy w innych kategoriach urządzeń. Ale równie trudno nam przewidzieć przyszłość, w której mówimy o maszynach mniej.

Wydawcy powinni unikać krótkowzrocznych strategii głosowych. Zamiast przyjmować podejście uniwersalne, zachęcamy media do radzenia sobie z egzystencjalnymi pytaniami dotyczącymi głosu i tego, jak to nowe medium wpłynie na nie.

Jeśli zaczynasz nowy projekt w głosie, nie krępuj się zagłębiać w naszą pracę. Otworzyliśmy kod z naszych dwóch dużych projektów, Guardian Briefing i Year in Review . Mam nadzieję, że mogą one być pomocne w przygotowaniu do działania.

Eksploracja tej granicy była trudna i ekscytująca. Nie możemy się doczekać, aby zobaczyć, co dalej.