Wszyscy kłamią… — Seth Stephens-Davidowitz

przez Karol Bocian | 26 kwietnia, 2022
Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy — Seth Stephens-Davidowitz

Przeczytałem ostatnio książkę: Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy. W tym wpisie dzielę się informacjami, które w niej znalazłem oraz które wdrożyłem w swoim życiu. Staram się z każdej książki wdrażać minimum jedną rzecz.

Wdrożyłem z książki: Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy:

  1. Używam Google Trends do sprawdzania, czego ludzie naprawdę poszukują. Stawiam na to, co ludzie robią, a nie co mówią.

Notatki z książki: Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy:

Big Data daje nam ogromne możliwości. Facebook, Twitter oraz wyszukiwania Google to skarbnica wiedzy. Są to jednak różne dane. Zazwyczaj wyszukiwania w Google są szczere, zaś dane w social mediach są wybrane (tylko piękne zdjęcia i miłe chwile) oraz wyolbrzymione (filtry na Instagramie). Wszyscy kłamią…

Wyszukiwania w Google pozwalają wykonać wiele badań. Na przykład dane z wyszukiwań pozwoliły znaleźć symptomy raka trzustki. Szukano je w taki sposób:

  1. Szukasz wszystkich osób, które wpisały w wyszukiwarkę, że mają raka trzustki.
  2. Szukasz wszystkich osób, które wpisywały coś w wyszukiwarkę, ale nie mają raka trzustki.
  3. Szukasz różnic między tymi osobami, np.
    1. Pierwsza grupa wpisywała ból pleców i żółknięcie skóry, a grupa druga wpisywała albo ból pleców, albo żółtą skórę, nigdy razem. Ta para jest (może być) symptomem.

Ludzie oficjalnie nie przyznają się do wielu rzeczy (na FB, w ankietach). Z tego powodu nasz obraz społeczeństwa odbiega od rzeczywistości. Prawdę możemy znaleźć:

  • W prawdziwych działaniach (np. anonimowe głosowanie), ale nie zawsze (np. gdy działanie nie jest anonimowe).
  • W anonimowym wyszukiwaniu informacji w Google i innych wyszukiwarkach (to nie zawsze jest anonimowe, ale ludzie rzadko biorą to pod uwagę). W wyszukiwarkach są szczere i prawdziwe informacje (o ile wyszukiwarka nie podpowiada wpisywanej frazy oraz my mamy małe doświadczenia z danym medium i nie dostosowujemy wpisywanych informacji do niego).

Przeglądanie wyszukiwań ludzi daje wiele informacji, również o małych grupach (w skali świata są one duże). Można znaleźć wiele korelacji i prognozować przyszłość na podstawie aktualnie wyszukiwanych informacji przez ludzi. Można też obserwować, jak dane działanie zostało odebrane (np. sprawdzić, czy w internecie huczy). Ludzie wpisują w wyszukiwarkę nie tylko pytania, ale również swoje prywatne przemyślenia (Google jest jak konfesjonał).

Internet to również wiele kłamstw i niedomówień. W mediach społecznościowych zamieszczamy tylko najfajniejsze wycinki naszego życia (często je ubarwiając), a o tej niefajnej części naszego życia w ogóle nie mówimy. Media społecznościowe zawierają takie informacje, którymi podzieliłbyś się z innymi ludźmi — a jak wiemy, tajemnic innym ludziom nie zdradzamy. Media społecznościowe są przeciwieństwem serum prawdy.

Na przykładzie historii o Netflixie można zobaczyć, że często robimy coś, bo chcemy jacyś być. Np. w Netflixie można było zapisać sobie listę filmów do obejrzenia. I ludzie wpisywali tam bardzo ambitne filmy, ale ich nie oglądali. Dlaczego? Bo zazwyczaj nie chce nam się oglądać wymagających filmów. Wolimy jakieś przyjemne seanse. Dlaczego zatem ludzie ich nie wpisywali? Bo głupio się przyznać, nawet przed sobą samym, że jesteśmy przeciętni, nie interesujemy się ambitnym kinem, lecz zwykłymi romantycznymi komediami.

Big Data zmieniają formę nauk humanistycznych. Mogą być jak fizyka — oparte na liczbach i prawdziwych działaniach. Pozwalają robić wiele eksperymentów w krótkim czasie. Przydatne są tutaj testy A/B, gdzie prezentujemy części osób opcję pierwszą, a opcję drugą pozostałym i sprawdzamy, jak na nie reagują. Niestety, w naukach humanistycznych nie znajdziemy prostych reguł jak w fizyce. Ludzie wciąż ewoluują, adaptują się i zmieniają.

W książce przedstawionych jest wiele ciekawych historii. Jedną z nich jest książka o kupowaniu konia wyścigowego. Bogaty szejk zatrudnił specjalistów do wybrania najlepszego konia wyścigowego. Jego specjaliści byli jednak inni niż wszyscy pozostali. Wszyscy specjaliści opierali głównie swoje predykcje co do szans na zwycięstwa danego konia o jego rodowód. Ci specjaliści dodali jednak dużo więcej badań. Mierzyli np. wielkość serca. Po kilku dniach robienia różnych pomiarów specjaliści szejka doradzili mu, aby nie sprzedawał swojego konia, bo on właśnie jest tym najlepszym. Po jakimś czasie ten właśnie koń przeszedł do historii jako najlepszy!

Inną ciekawą historią jest opowieść o wyszukaniach typu: jak zabić swoją dziewczynę. Takie wyszukiwania czasami kończą się zabójstwami. Czy zatem powinniśmy czytać wszystkie wyszukiwania, a gdy pojawi się powyższe, to wysyłać policję? A co z wolnością słowa i etyką? A może powinniśmy w tej sytuacji powiadomić tę biedną dziewczynę? Co ciekawe, takich wyszukiwań jest bardzo dużo, a zabójstw jest naprawdę niewiele. W dodatku, gdyby przestępcy dowiedzieli się, że są śledzeni, zmieniliby swoje zwyczaje. Oberwałoby się za to (inwigilacją) zwykłym Kowalskim.

Jest jeszcze inna strona takich wyszukiwań: jeżeli zanonimizujemy dane i będziemy tylko śledzili trendy, wtedy możemy reagować na grupę — bez ograniczania wolności oraz z większą efektywnością. Prawdopodobieństwo, że ktoś, kto wpisał: śmierć muzułmanom, zrobi im krzywdę, jest niewielkie. Lecz prawdopodobieństwo ataku na muzułmanów w mieście, w którym znacząco wzrosła liczba takich wpisów, bardzo się zwiększa. Co zatem można zrobić? Można obserwować trendy i na nie reagować. Np. zaobserwowaliśmy wzrost wyszukiwań: jak popełnić samobójstwo -> robimy kampanie zwiększająca radość z życia. Zaobserwowaliśmy wzrost wpisów: śmierć muzułmanom -> wypuszczamy więcej patroli policji oraz przeprowadzamy akcję integracji ze społecznością muzułmańską.

I na sam koniec, jedna z najważniejszych rzeczy. Musimy nauczyć się i zwracać na to baczną uwagę: jest ogromna różnica między korelacją i przyczynowością. Korelacja często nie implikuje przyczynowości. W celu wykrycia, czy coś jest ze sobą tylko skorelowane, czy zachodzi przyczynowość, można zastosować środek placebo — część badanych nie dostaje nowego bodźca, lecz myślą, że dostają.

Wszystkie posty związane z książkowymi wdrożeniami:

Źródła

Obraz główny

  • Praca własna – książka: Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy.
  • https://www.pexels.com/video/man-in-a-hammock-at-the-beach-6502118/

Materiały: książka: Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy:

  • Wszyscy kłamią: big data, nowe dane i wszystko, co Internet może nam powiedzieć o tym, kim naprawdę jesteśmy — Seth Stephens-Davidowitz

 

Linki oznaczone (*) są linkami afiliacyjnymi. Jeżeli uważasz, że czerpiesz korzyści z mojej pracy, to kup coś korzystając z powyższego linku. Sprawi to, że dostanę prowizję z afiliacji.

 

Dodaj komentarz

Twój adres e-mail nie zostanie opublikowany. Wymagane pola są oznaczone *