• TECHNOFOBIA
  • Posts
  • Hej, Siri! | TECHNOFOBIA | Newsletter Artura Kurasińskiego

Hej, Siri! | TECHNOFOBIA | Newsletter Artura Kurasińskiego

Siri to prawdopodobnie pierwsza asystentka głosowa, którą poznał świat. Mimo to nawet dzięki ogromnej początkowej przewadze, Google, Amazon i inne firmy technologiczne wręcz z dziecięcą łatwością wyprzedzają Apple w tej dziedzinie.

Co się z nią stało? Co musi się stać, by Siri znowu mogła konkurować z resztą jak równy z równym?

Zacznijmy od początku. Siri Inc. powstało w 2007 roku. Twórcami są Dag Kittlaus, Adam Cheyer i Chris Brigham. Według ich wizji aplikacja miała być inteligentnym asystentem głosowym, który nie tylko będzie odpowiadał na zachcianki użytkownika, ale także wchodził z nim w interakcję i zadawał pytania, w taki sposób, by przygotować najlepiej dopasowaną odpowiedź.

Jakby to miało wyglądać w praktyce? Wyobraź sobie, że Twój wirtualny pomocnik nie tylko wybrał numer do restauracji, ale wcześniej zebrał informacje o Twoich zachciankach, czy liczbie gości, a następnie przeprowadził rozmowę i zrobił rezerwację.

Jedyną drogą rozwoju według ówczesnych twórców, była otwarta platforma, która integruje się z aplikacją. Uważali, że ich wewnętrzny zespół to za mało, by zrealizować tak zaawansowany program. A dzięki współpracy z zewnętrznymi programistami, miały wzrosnąć szanse na stały progres w projekcie.

Była jeszcze jedna osoba, która widziała tutaj ogromny potencjał. Steve Jobs. To on przekonał Dana, Adama i Chrisa, że będzie w stanie urzeczywistnić ich pomysł na skalę globalną.

W kwietniu 2010 roku Apple kupiło Siri za 200 milionów dolarów. W dalszym ciągu Jobs był mocno zaangażowany w pracę nad aplikacją. Pojawiał się na spotkaniach, kierował zadaniami itd. By zdążyć z premierą, Apple ograniczyło możliwości asystenta. Jak się później okazało, to, w połączeniu ze śmiercią Steve’a Jobsa było strzałem w kolano.

Oficjalna premiera asystenta głosowego miała miejsce 4 Października 2011, na wydarzeniu „Let’s Talk Apple”. Phil Schiller, ówczesny Senior Vice President of Worldwide Product Marketing tak zapowiedział nowy produkt:

For decades, technologists have teased us with this dream that you’re going to be able to talk to technology, and it’ll do things for us. Haven’t we seen this before, over and over? But it never comes true. What we really want to do is just talk to our device,” he said, “and your device – in this case, your phone – will figure out what you mean and help you get what you want done. That’s a feature on the iPhone 4s we call Siri.

Powyższą prezentacje znajdziesz pod tym linkiem.

Podczas tego eventu, firma ogłosiła również Iphone’a 4s. Smartfon zawierał tylko mniejsze poprawki względem wcześniejszej wersji. Daleko mu było do innowatorskiego iPhone 5. Brakowało efektu WOW. Teraz już wiemy – Siri uratowała im wyniki w 2011.

Niestety, to nie jakość stała za produktem, a świetny PR. Według byłych pracowników, wprowadzenie go na rynek było za szybkie. Brakowało podstawowych funkcjonalności, a w dodatku wewnętrzne zespoły prowadziły ze sobą walkę, o to, jak ma wyglądać jej idealna wersja.

Budowane zainteresowania wokół projektu pozwoliło na chwilowy sukces. Wielu dziennikarzy rozpływało się nad nowym wynalazkiem. „Działa lepiej niż przypuszczaliśmy”, „zmienia całkowicie postrzeganie telefonu”. To komentarze z największych gazet.

A co z problemami? Te nie istniały. Przynajmniej według krytyków. A jeśli już się pojawiały, to były sprowadzane do rozmiaru błahostki. Ewentualnie zrzucano winę na wersję beta, która “z pewnością zostanie ulepszona”.

Konkurencja nie spała i już w 2012 roku Samsung wypuszcza S Voice. W porównaniu do rozwiązania Apple, aplikacja koreańskiej korporacji wypadała… blado. Mogliśmy się tego spodziewać, prawda? Apple jest liderem na rynku, Samsung kopiuje ich rozwiązanie, ale to Apple ma przewagę technologiczną. W tym samym roku do gry wkracza Google z Google Now. To uboższa wersja znanego nam dobrze Asystenta Google. I już tutaj pojawia się spora różnica między asystentami.

Przenieśmy się do 2014 roku. W blasku reflektorów na scenę wchodzi Microsoft z Contraną. Cóż, połączenie Windows Phone z aktualizacją 8.1 i Bing nie mogło zagwarantować sukcesu.

Pojawia się też inny gracz, który niespodziewanie odmienił całą branżę. Amazon i jego Echo, czyli domowy asystent głosowy.

To było totalne zaskoczenie. Firma Bezosa była raczej znana z produktów, które wspólnie się komplementują (np. ebooki i Kindle, czy Amazon Prime i Tablety) i pozwalają podbijać sprzedaż. A Echo? Nie pasowało do tego schematu. W momencie premiery udostępniono tylko możliwość zakupu muzyki przez głośnik... Jego przyszłość rysowała się w szarych kolorach.

Wróćmy do Siri. Co się z nią dzieje? Cóż – niewiele. W odpowiedzi na wejście Amazona, firma ogłasza Sirikit. Lecz do życia wprowadza go dopiero po kilku miesiącach i nawet ta opcja ma swoje limity. W 2016 roku Google Now zamienia się w Google Assistant.

To kolejny kamień milowy w historii tej technologii. Google wprowadziło branżę asystentów na kolejny poziom. A Apple? Najlepiej odwzorowuje to podsumowanie Steve’a Wozniaka:

Sometimes Siri doesn't get the words right, and I'm pissed.

Więc jak to się stało, że gigant technologiczny, który z taką przewagą wchodził na rynek, stracił ją całkowicie?

Wydawało się, że ma wszystko w swoich rękach. A teraz jest daleko w tyle i musi gonić, by chociaż zrównać się z innymi. Powodów jest kilka.

Wiele osób twierdzi, że zamiłowanie Apple do prywatności i niewykorzystywanie danych zbieranych od użytkowników wpłynęło na brak aktualizacji. Oczywiście w ostatnich kilku latach firma inwestuje w rozwiązania związane z prywatnością, ale nie są święci w tej dziedzinie.

Pojawiały się raporty, według których poufne dane od użytkowników asystenta głosowego były przekazywane do analityków. Pomińmy nawet tę kwestię, tak dużego gracza po prostu stać na zakup danych i analiz do dalszych aktualizacji.

Pierwszą realną przyczyną, która ma wpływ na pozycję Siri, jest brak jasnej wizji produktu. W zasadzie koncepcja zakończyła się wraz ze śmiercią Jobsa. - When Steve died the day after Siri launched, they lost the vision. They didn’t have a big picture -wspomina jeden z byłych pracowników Apple.

W firmie panował wyraźny podział zdań co do jej zastosowania i możliwości. Całe zamieszanie wyraźnie wstrzymywało dalsze poprawki. Postęp aplikacji nie był wysoko na liście priorytetów. Według raportów The Information, Richard Williamson podjął decyzję, by wprowadzać zmiany raz do roku.

To samo podejście stosowane jest przy iOS i wielu współpracowników się z nim nie zgadzało. Walczyli o to, by aktualizacje wprowadzano w sposób ciągły. Bezskutecznie. Niesnaski doprowadzają do rotacji w kadrze kierowniczej i znowu zmienia się pomysł na asystenta. Zamknięte koło.

Jobs widział potencjał w Siri jako AI. Nie chciał, by stała się tylko narzędziem do znajdywania informacji. W 2012 Bill Stasior przejmuje pieczę nad projektem i wybiera właśnie drogę „wyszukiwarki”. Mamy kolejną serię „buntów” wewnątrz zespołu. Pracownicy twierdzili, że Bill nie ma odpowiedniej wiedzy z analizy języka i mowy, by z sukcesami prowadzić program.

Zaraz po tym, Stasior dostaje wolną rękę i przejmuje inne firmy związane z wyszukiwaniem informacji. Zespół Siri znacznie się powiększył, w efekcie czego zaczęło dochodzić do coraz większych tarć. Rywalizacja pomiędzy zespołami była widoczna gołym okiem. Panowało przeświadczenie, że nowi członkowie chcieli zamknąć Siri jako aplikację:

There was a feeling that, ‘Why don’t we just start over and build what we need to build, and then worry about reconciling those two later?

Z drugiej strony trudno im się dziwić. Wsparcie i progres Siri był znikomy, a początkowa wizja projektu znacznie odbiegała od specjalizacji nowych członków. Każda z takich akcji podkopywała cały program i utrudniała dalsze prace nad nim.

Prócz tego, do całości dochodzi brak możliwości współpracy asystenta z innymi systemami. Nawet integracja z iOS sprawiała problemy. Produkty Apple słyną z tego, że są banalne w obsłudze i sprawnie funkcjonują w swoim ekosystemie. Kiedy asystent głosowy przejmuje dowodzenie, to rzeczy po prostu przestają działać. Siri dostępna jest tylko na urządzeniach Apple. A jeśli chcesz używać Google Assistanta lub Alexy to możesz to robić na Androidzie, iOSie, słuchawkach, smartwatchu… możliwości jest multum.

Krytyczny wpływ na regres aplikacji miała rezygnacja ze współpracy z third-party-services po przejęciu produktu w 2010 roku. To całkowite odejście od pomysłu pierwszych twórców. Zmiana nastąpiła dopiero w 2016, lecz o 6 lat za późno.

Wówczas Apple ogłosiło, że Siri będzie działać razem z third-part-apps. W tym momencie Echo Amazona miało wprowadzonych 1400 różnych „umiejętności” zbudowanych przez z third-party developerów, a Google opracowało już swojego Asystenta, bazującego na AI.

Jeśli tego było mało, to wydaje się, że oczekiwania wokół aplikacji były po prostu za wysokie. Nie doczekaliśmy się obiecanych rezultatów. W tym przypadku hype przygniótł Apple.

Co musiałoby się stać, by Siri znowu wróciła na piedestał?

Przede wszystkim potrzebna jest jedna, spójna wizja Apple. Dalej nie wiemy, w którą drogę wybiorą. Czy będzie to narzędzie, które umożliwi kontrolę głosową urządzeń? A może coś bardziej ambitnego – czyli asystent z prawdziwego zdarzenia, który będzie Cię wspierał w bardziej wymagających zadaniach?

Na razie program był wykorzystywany do pompowania marketingu, a jego funkcjonalność była uboga. Zmiany wprowadzone w iOS 15 raczej cofają projekt w rozwoju, niż pomagają mu w rozwinięciu skrzydeł. Rok temu aplikacji odebrano masę funkcjonalności (np. związanymi z notatkami, zdjęciami).

Natomiast pojawia się światełku w tunelu. Według ekspertów Siri wraca do łask zarządu. To dobry znak, bo potencjał drzemie ogromny w tym rynku. Na świecie jest ponad 1.8 miliarda urządzeń od Apple, z czego ponad 1 miliard stanową iPhone’y.

Od 2011 wypuścili masę produktów, które w dużej mierze bazują na komendach głosowych. Do tego dochodzi zestaw VR/AR, który ma wejść na rynek w styczniu 2023. Wszystkie urządzenia potrzebują dobrego asystenta głosowego i otwierają spore możliwości.

Podczas tegorocznego WWDC zapowiedzieli 8 zmian dla asystenta głosowego – otwieranie skrótów przy pomocy Siri, dyktowanie emoji, czy lepsza obsługa, kiedy telefon jest w trybie offline. Wygląda obiecująco, natomiast z ocenami lepiej poczekać do wypuszczenia oficjalnej bety (Lipiec 2022).

Z drugiej strony firma musi obniżyć oczekiwania wobec projektu i zacząć pracować nad fundamentami, które w dłuższej perspektywie pozwolą dogonić konkurencję. Czy Amazon i Google pozwolą się dogonić? Tego nie jestem pewny.

Artur Kurasiński