• TECHNOFOBIA
  • Posts
  • Alexa z Polski - Newsletter Artura Kurasińskiego

Alexa z Polski - Newsletter Artura Kurasińskiego

Brad Stone w swojej nowej i fascynującej książce "Amazon unbound" opisuje wiele historii związanych z rozwojem firmy stworzonej przez Jeffa Bezosa.

To już druga książka tego autora po wydanej w 2013 roku "The Everything Store: Jeff Bezos and the Age of Amazon". opisujących fenomen firmy z Seattle.

Polecam obie książki - szczególnie fajnie jest je przeczytać w kolejności pisania żeby zobaczyć jak zmieniała się "największa na świecie księgarnia".

Od czasów pierwszej książki zmieniło się wszystko - rynek, konkurencja, przepisy a przede wszystkim produkty Amazona.

Obecnie dzięki chmurze obliczeniowej dowolna firma może wynająć zasoby, programistów i ekspertów ds. bezpieczeństwa od zewnętrznego dostawcy, takiego jak Amazon, zamiast utrzymywać własne centra danych.

Amazon był pionierem w dziedzinie cloud computingu na początku lat 2000, a w 2010 roku stał się liderem rynku. I dzisiaj czerpie z tego ogromne profity.

Amazon Web Services, the cloud computing giant led by the now-future Amazon CEO, closed out 2020 with more than $13.5 billion in annual operating profits, responsible for more than 63% of the entire company’s operating profits for the year, on annual AWS revenue of $45.3 billion, up nearly 30% year-over-year.

To co dla mnie było najbardziej fascynującego w "Amazon unbound" jest historia powstania Alexy (inteligentnego asystenta zarządzanego głosem) z uwagi na bardzo silny polski akcent tego wydarzenia.

Historia rozpoczyna się w roku 2011 kiedy Bezos napisał do kilku menedżerów Amazon taką wiadomość:

"Powinniśmy zbudować urządzenie za 20 dolarów z mózgiem w chmurze, które będzie całkowicie sterowane głosem użytkownika".

Na lidera projektu Bezos wybrał Grega Harta (doradcę technicznego Bezosa). Szef Amazona wyznaczył Harta do stworzenia i nadzorowania zespołu, który miał pomysł "komputera głosowego" przekształcić w rzeczywisty i realny produkt w czasie zaledwie 12 miesięcy.

"Jeff, nie mam żadnego doświadczenia w dziedzinie sprzętu, a największy zespół programistów, jakim kierowałem, liczył zaledwie około 40 osób" - wspomina Hart.

"Dasz sobie radę" - odpowiedział Bezos.

Hart zdążył dodać jeszcze "Dobrze, pamiętaj o tym, gdy będziemy nawalać po drodze".

Przez następny trzy lata Jeff Bezos był bardzo mocno zaangażowany w powstawanie i rozwój projektu. Bez wahania przeznaczał setki milionów dolarów na rozwój zespołu czy zakup technologii. Nadzorował, dopytywał, krążył wokół zespołu usuwając mu spod nóg wszelkie korporacyjne przeszkody.

Osoby pracujące w teamie Harta nazywali Bezosa "über menedżerem produktu" z uwagi na jego chęć decydowania o wszystkim i to pod kątem jego wizji Alexy.

Ponieważ szef projektu Hart (podobnie jak sam Bezos) uwielbiał zachowywać dyskrecję wokół firmowych projektów (a jego zespół pracował w tym samym budynku co zespół rozwijający Kindle) to w trakcie rekrutacji pytał "jakbyś zaprojektował Kindle dla niewidomych?"

To zupełnie nie dziwiło osoby zapraszane na spotkania rekrutacyjne. Wieści o dziwnych i cudownych wynalazkach krążyły "po branży" od dawna.

W Lab126 (liczba "126" pochodzi od strzałki w logo Amazon, która wskazuje od A do Z, czyli początkowych i końcowych liter alfabetu angielskiego) tworzono zaawansowane projekty, które miały być znakiem firmowym Amazona.

Już w 2007 roku, Lab126 dostarczyło swój pierwszy produkt - czytnik Amazon Kindle, który odniósł wielki sukces i zmienił branżę wydawniczą. W kolejnych latach, w Lab126 skonstruowano tablet Kindle Fire, Amazon Fire TV i Fire Phone.

Projekt niemrawo toczył się aż do 4 października 2011 roku kiedy to firma Apple ogłosiła, że wprowadza swojego wirtualnego asystenta, Siri do iPhone'a 4S. To był ogromny cios i zaskoczenie dla całego zespołu i samego Bezosa.

Siri była ostatnim, wielkim projektem Steve Jobsa i traktowana była przez Tima Cooka jako bardzo ważny element ekosystemu produktów Apple. Wszyscy pracujący nad projektem "głosu w chmurze" rozumieli, że teraz będą musieli nie tylko zmagać się z technologią ale też potężną konkurencją.

Inżynierowie w Lab126 postawili poprzeczkę wyżej niż ci z Apple - ich urządzenie miało działać (rozumieć komendy głosowe) w hałaśliwych pomieszczeniach a komendy nie miałby być wypowiadane bezpośrednio do mikrofonu urządzenia. To wymagało poszerzenia wiedzy całego zespołu. Oraz rozwiązania całej masy problemów.

I tak trafiono na polski projekt Ivona. Założony przez Michała Kaszczuka i Łukasza Osowskiego w 2001 roku (studenta informatyki na Politechnice Gdańskiej) jako IVO Software - syntezator mowy, który wielokrotnie zdobywał nagrody za najbardziej naturalne oddanie ludzkiego głosu.

Łukasz i Michał wpadli na pomysł, że dzięki zastosowaniu text-to-speech może odczytywać cyfrowe teksty na głos i pomóc osobom niedowidzącym.

Wspólnie z młodszym kolegą z klasy, Michałem Kaszczukiem, nagrali głos aktora i wybierali fragmenty słów, zwane difonami, a następnie mieszali je ze sobą w różnych kombinacjach, aby przybliżyć naturalnie brzmiące słowa i zdania, których aktor nigdy by nie wypowiedział.

Założyciele Ivona szybko mieli okazję przekonać się, jak sprawna może być ich technologia. Właśnie zakończyli nagrywanie głosu profesjonalnego aktora Jacka Labijaka, żeby stworzyć z niej bazę danych dźwięków.

Powstał w ten sposób Spiker, którego zapewne mieliście kilka razy usłyszeć jeśli korzystalicie dekadę temu z internetu i nie tylko.

Stał się on bowiem powszechnie używany w metrze, windach i w kampaniach z automatycznym dzwonieniem. Jacek Labijak zaczął słyszeć siebie wszędzie i odbierał nawet telefony, w których jego głos namawiał go np. do głosowania na jakiegoś kandydata w nadchodzących wyborach.

Pranksterzy manipulowali oprogramowaniem, aby Labijak mówił niestosowne rzeczy i umieszczali nagrania w Internecie, gdzie odkryły je jego dzieci. Jak twierdzi Stone twórcy Ivony musieli renegocjować kontrakt z aktorem kiedy ten wkurzony próbował zerwać umowę.

W 2006 roku zespół twórców Ivony zaczął regularnie brać udział w corocznym konkursie Blizzard Challenge, organizowanym przez Carnegie Mellon University, na najbardziej naturalny głos komputerowy, i wielokrotnie go wygrywała.

Do roku 2012 roku Ivona rozszerzyła swoją działalność na 20 innych języków i oferowała ponad 40 głosów. Hart i Al Lindsay, pierwszy kierownik inżynieryjny projektu, odwiedzili ich w Gdańsku podczas podróży po Europie w poszukiwaniu firm i technologii do przejęcia. Wiedzieli, że trafili na technologię idealną dla projektu Alexa. Postanowili złożyć chłopakom ofertę.

Stone twierdzi, że Ivona została kupiona za 30 mln dolarów (kwota ta nigdy w polskich mediach nie została potwierdzona) a Bezos potem osobiście nadzorował zatrudnianie nowych pracowników w gdańskim centrum R&D w którym miano tworzyć software umożliwiający mówienie Aleksie.

Program nadal był zarządzany przez samego Bezosa i podlegał jego zwyczajowym ciekawostkom i kaprysom. Na początku szef Amazona zdecydował, że chciałby, aby z urządzenia wydobywały się dziesiątki różnych głosów, z których każdy byłby związany z innym celem lub zadaniem, takim jak słuchanie muzyki lub rezerwacja lotu.

Gdy okazało się to niepraktyczne, zespół zastanowił się nad listą cech pożądanych u jednej osobowości, takich jak wiarygodność, empatia i ciepło, i ustalił, że cechy te są częściej kojarzone z głosem kobiecym.

Aby opracować ten głos i upewnić się, że nie ma w nim śladu regionalnego akcentu, zespół Ivony współpracował ze studiem lektorskim GM Voices z Atlanty - tą samą firmą, która pomogła przekształcić nagrania aktorki głosowej Susan Bennett w agenta Apple, Siri.

Tymczasem pojawił się ogromny problem z uczeniem mówienia algorytmu. Wśród inżynierów doszło do podziału zdań w jaki sposób mają tworzyć "inteligencję" Alexy - czy za pomocą grafów wiedzy czy może za pomocą metody rozumienia języka naturalnego ("głębokim uczeniem").

Wygrało drugie podejście, ale jego realizacją okazała się ekstremalnie trudna - trzeba było bowiem wymyśleć sposób w jaki użytkownicy mają korzystać z urządzenia i uczyć algorytm Alexy nawet jeśli nie jest był on zbyt "bystry" a używanie go było męczarnią.

Rozwiązano to poprzez zakup danych od australijskiej firmy AMPED. Firma ta wynajmowała domy i mieszkania, ukrywała urządzenia z Alexą i "zaśmiecała" pomieszczenie innymi urządzeniami jak konsole, telewizory czy tablety, które generowały dźwięki.

W takim środowisku użytkownicy porozumiewali się z Alexą (a dokładnie z 20 urządzeniami w każdym domu rozmieszczonych na różnych wysokościach). Dzięki temu nastąpił gwałtowny wzrost danych a sama Alexa zaczęła spełniać oczekiwania Bezosa.

Alexa miała już swój głos, potrzebowała teraz "ciała".

Pierwsze eksperymentalne urządzenia były, według wszystkich relacji pochodzących od osób zaangażowanych w projekt były...powolne i bardzo często nie działały tak jak spodziewali się ich twórcy.

Być może najbardziej negatywna recenzja zespół otrzymał od samego Bezosa. Prezes Amazona testował urządzenie w swoim domu w Seattle, a w przypływie frustracji z powodu braku zrozumienia co mówił do urządzenia, powiedział Alexie, aby poszła "strzelić sobie w łeb".

Jeden z inżynierów, który usłyszał ten komentarz podczas przeglądania interakcji Bezosa z urządzeniem testowym, powiedział: "Wszyscy myśleliśmy, że to może być koniec projektu, a przynajmniej koniec kilku z nas jako pracowników w Amazonie".

Na szczęście do niczego takiego nie doszło. Testy przebiegły pomyślnie. Oprogramowanie urządzenia było gotowe. Zostało tylko wybrać formę fizyczną dla głosu Alexy.

I tu ciekawostka. Przed wysyłką urządzeń do klientów trwały debaty nad projektem produktu. Jednym ze spornych kwestii było to, jak wyraźnie Alexa może słuchać komend użytkownika, jednocześnie sama emitując dźwięki.

Inżynierowie zalecili zbudowanie małych urządzeń w kształcie krążków hokejowych, które miały być rozmieszczone w całym pomieszczeniu, aby pomóc w odbieraniu poleceń użytkownika, gdy ten oddalił się od zasięgu mikrofonu głównego głośnika.

Pomysł ten został odrzucony przez kierownictwo firmy, które uważało, że nie powinno być żadnych dodatkowych urządzeń, które poprawiałyby wydajność. Przy innej okazji, niektórzy inżynierowie nalegali, że powinien istnieć pilot, za pomocą którego użytkownik mógłby mówić z dowolnego miejsca w domu.

Kierownictwo ponownie sprzeciwiło się temu pomysłowi, uważając, że głos powinien być jedyną formą wprowadzania danych, nie powinno się dodawać żadnych fizycznych interakcji pomiędzy użytkownikiem a urządzeniem. Aby rozstrzygnąć spór, postanowiono pozwolić użytkownikom podjąć decyzję.

Pierwsza partia dostarczonych głośników była wyposażona w pilota, a dane analityczne dotyczące użytkowania zostały przesłane z powrotem na serwer Amazona.

Z danych tych wynikało, że piloty prawie nigdy nie były używane, więc od tamtej pory do głównego urządzenia nie dołączano żadnych dodatkowych gadżetów, a jedynym kanałem interakcji był głos.

Debiut Amazon Echo nastąpił 6 listopada 2014 roku, ale poprzedzony został porażką innego produktu na który Bezos stawiał czyli Fire Phone. Podczas konferencji ani Bezos ani team Harta nie chciał stwarzać pozorów, że technologia, którą prezentują jest wyjątkowo przełomowa (bojąc się rozczarowania klientów i mediów).

Zachowawczo również podchodzono do ilości egzemplarzy - zamówiono wstępną partię tylko 80 tys urządzeń (w porównaniu do wstępnego zamówienia ponad 300 tys Fire Phone'ów). 

"Fire Phone z pewnością sprawił, że ludzie stali się nieco ostrożni" - mówił Greg Hart. "To skłoniło nas do ponownego przeanalizowania wszystkiego".

Okazało się jednak, że wizja Bezosa (komputera podłączonego do chmury z którym można rozmawiać za pomocą głosu) bardzo szybko szybko zdobyła popularność wśród klientów.

Produkt nie okazał się finansową wtopą. Alexa zmieniła sposób w jaki klienci kupowali produkty na Amazonie.

Sprzedaż inteligentnych głośników osiągnęła 147 milionów sztuk na całym świecie w 2019 roku, co odzwierciedla 70% wzrost w stosunku do 2018 roku, wynika z nowych danych Strategy Analytics. Udział Amazona w tym rynku to 26,2%

Całkiem nieźle jak na szalone marzenie despotycznego szefa.

PS Jeśli spodobał Ci się ten tekst to tutaj możesz mnie wesprzeć. Wyceniłem koszt miesięcznego wsparcia (8 wydań) na 12 złotych. Jeśli uznasz, że to co pisze i wiedza jaką przekazuję ma dla Ciebie sens to zapraszam do wspierania. Dziękuję!

Projektowanie doświadczeń tematem najnowszego odcinka "Rozmów Facebooka"

O projektowaniu doświadczeń i usług, które zachwycają konsumentów opowiadają Dariusz Knopiński, UX & Conversion Director w Allegro i Agnieszka Szóstek, ekspertka i autorka książki The Umami Strategy.

W szóstym odcinku drugiego sezonu podcastu "Rozmów Facebooka" goście opowiadają o tym, co jest kluczowe w badaniach i projektowaniu doświadczeń konsumenckich oraz który etap procesu jest najtrudniejszy. Rozmawiają o tym, jak pandemia zwiększyła świadomość konsumentów na temat oferowanych rozwiązań oraz jaki to ma wpływ na przyszłość pracy specjalisty ds. badań i projektowania doświadczeń.

OVHCloud Deals | Rozwiązania dla e-commerce i narzędzia do pracy zdalnej

REKLAMA

W ostatnich latach nastąpił intensywny rozwój sprzedaży internetowej oraz pracy zdalnej. Dziś stanowią one kluczowe wyzwania dla Twojej działalności. Dostawca usług musi być obecny w sieci, widoczny i reaktywny, aby spełnić oczekiwania swoich klientów, jednocześnie pamiętając o potrzebach swoich pracowników. Towarzyszymy Ci na każdym etapie realizacji projektów, dostarczając odpowiednie rozwiązania i służąc radą.

Sprawdź nasze rozwiązania w promocji:

👉 dla e-commerce >>SPRAWDŹ<<

👉 dla pracy zdalnej >>SPRAWDŹ<<

🤖 PORTALE PRACY PRZYSZŁOŚCI

Rocket Jobs PL to job board dla marketingu i nowoczesnej sprzedaży. Just Join IT daje największy wybór polskim programistom. Jednak jak sami twierdzą, są czymś więcej niż tylko job boardami - to portale pracy przyszłości.

Możecie przekonać się sprawdzając na

Podcast Człowiek Biznes Technologia

REKLAMA

Ewa Szmidt-Belcarz – O Cyfrowej rewolucji w najstarszej księgarni w Polsce

Gościem kolejnego podcastu Człowiek Biznes Technologia jest Ewa Szmidt-Belcarz, prezes Empiku. Z Ewą Wiesław rozmawia o historii firmy Empik, o tym jak organizacja ewoluowała na przestrzeni lat oraz jak zmieniła się rola sklepów fizycznych i w jaki sposób pandemia COVID-19 wpłynęła na rozwój firmy. Rozmawiają także o tym, jak obecnie wygląda rynek i na jakim rynku działa teraz Empik.

PRZEJDŹ Z KSIĘGOWOŚCIĄ DO INFAKTU!

Co to dużo pisać - lubię inFakt. Korzystam z ich usług od ponad dekady. Nie raz mobilny dostęp do aplikacji ratował mi tyłek. A obecnie w prowadzeniu mojej małej firemki (tak, mam JDG) pomaga mi księgowy (Pan Wojtek). No więc polecam inFakt! ;)

✔️ TUTAJ WYBRIERAM I OBJAŚNIAM NIEKTÓRE ZAGADNIENIA ✔️

🔥 KAŻDY BĘDZIE OPŁACANYM INFLUENECEREM - Dzięki platformom takim jak OnlyFans i Patreon, ekonomia subskrypcji nie będzie już dłużej ograniczona do wojen streamingowych i wymiany ubrań.

Zamiast tego, wielu ludzi zacznie umieszczać swoje codzienne życie za płatnymi ścianami, by móc zarabiać na każdym swoim doświadczeniu i myśli.

Implikacje są ogromne i mogą zmienić sposób, w jaki ludzie poruszają się po świecie cyfrowym i przesunąć granice prywatności.

W miarę jak platformy społecznościowe nadają priorytet mikropłatnościom pochodzącym od społeczności, Jason Parham w Wired sugeruje, że możemy przenieść się w erę, w której każdy jest influencerem.

Dlaczego to jest ważne?

Ekonomista Jeremy Rifkin wyjaśnia, że Internet składa się z "relacji dostępu", gdzie "komunikacja, komunia i handel [są] nierozróżnialne".

  • Od Patreona, przez OnlyFans, po Discord, platformy otwierają możliwość uzyskania zapłaty za zajrzenie za kulisy. W przyszłości, ludzie będą mogli umieścić każdy aspekt swojego życia online za płatną ścianą.

  • Ludzie nadal będą żyć normalnym życiem, ale teraz będą mogli zarabiać dodatkowe pieniądze w trakcie wykonywania tych prac... po prostu filmując siebie lub tweetując o tym.

  • Widzowie nie będą już musieli "odkrywać" treści - będą mogli po prostu ściągnąć dowolną playlistę osób, które subskrybują.

Ponieważ OnlyFans ma ponad 20 milionów zarejestrowanych użytkowników i 200 000 "twórców", ta przyszłość może nie być odległa.

☁️ PROBLEMY Z PRYWATNOŚCIĄ - Amerykańskie firmy zaczęły borykać się z kosztownymi problemami za granicą, czekając, aż amerykańscy i europejscy partnerzy wypracują nowe porozumienie w sprawie prywatności, po tym jak UE unieważniła kluczowy międzynarodowy pakt w zeszłym roku.

Amerykańskie firmy, które działają na arenie międzynarodowej, twierdzą, że straciły ogromne sumy z powodu prawnego impasu.

Firmy, które dzielą się danymi z Europą kiedyś w dużej mierze polegały na umowie znanej jako Privacy Shield, aby zapewnić im ochronę przed odpowiedzialnością, ale europejski sąd najwyższy uderzył go w lipcu ubiegłego roku, a konsekwencje zaczęły się gwałtownie w branżach zależnych od danych.

Dlaczego to jest ważne?

W złożonych w tym roku przez Komisję Papierów Wartościowych i Giełd dokumentach z kilkudziesięciu różnych firm czytamy, że trwające zamieszanie wokół legalności transferu danych między USA a UE może zaszkodzić finansom, działalności i ofercie usług za granicą.

Amerykańska firma Mailchimp, zajmująca się marketingiem poczty elektronicznej, została uwikłana w spór prawny, gdy bawarski urząd ochrony danych nakazał europejskiemu czasopismu zaprzestanie korzystania z usługi do wysyłania newsletterów.

Microsoft ogłosił w zeszłym tygodniu, że zacznie przechowywać i przetwarzać dane klientów usług chmurowych w UE, powołując się na swoje zobowiązanie do przestrzegania unijnych przepisów dotyczących ochrony danych, w tym GDPR.

Przechowywanie danych lokalnie jest czymś, co duże firmy mogą osiągnąć ze względu na koszty. Dla mniejszych firm jest to bardziej prawdopodobne, że całkowicie stracą biznes w obliczu ryzyka regulacyjnego.

W kwietniu Federacja Europejskich Akademii Medycznych i Europejski Naukowy Komitet Doradczy poinformowały, że niepewność związana z udostępnianiem danych zdrowotnych poza UE zagraża podstawowym badaniom, w tym szczepionkom, a tysiące przypadków współpracy z USA zostało już dotkniętych tym problemem.

W kwietniu portugalska Krajowa Komisja Ochrony Danych Osobowych nakazała portugalskiemu biuru statystycznemu Statistics Portugal wstrzymanie wysyłania danych spisowych do USA, ponieważ biuro korzystało z usług amerykańskiej firmy Cloudflare.

🌱 KOSZTOWNA ZIELONA REWOLUCJA - Nadchodzący niedobór minerałów może znacząco wpłynąć na naszą "zieloną" przyszłość. Niedawno opublikowany raport Międzynarodowej Agencji Energii (IEA), podkreślił przeciwstawną relację między gwałtownie rosnącym popytem na rzadkie minerały a ich niewielką podażą.

Eksperci uważają, że to niedopasowanie może storpedować wysiłki krajów, które chcą osiągnąć zero netto emisji gazów cieplarnianych do 2050 roku, (co jest najnowszym celem ONZ)

Dlaczego to jest ważne?

Popularne rozwiązania w zakresie zielonej energii wykorzystują różne metale ziem rzadkich i minerały. Dwa przykłady:

Pojazd elektryczny (EV) zużywa 6x więcej zasobów mineralnych niż samochód na paliwa kopalne. Morska elektrownia wiatrowa wymaga 9x tyle zasobów mineralnych, co porównywalna elektrownia gazowa.

Według analizy IEA, do 2040 roku producenci będą potrzebowali 6x więcej minerałów niż produkuje się obecnie.

Przewidywany popyt na "białe złoto" - lit stosowany w akumulatorach pojazdów elektrycznych - jest niewiarygodny i ma wzrosnąć 70-krotnie w ciągu najbliższych kilku dekad.

Uwzględniając istniejące globalne kopalnie litu, bylibyśmy w stanie zaspokoić tylko około połowy popytu przewidywanego w tej dekadzie.

Ale jest nadzieja. Raport IEA nakreślił 6 obszarów działania w celu uniknięcia nadchodzącego niedoboru, który obejmuje rozwój zielonych technologii, które nie są tak zależne od minerałów.