Kto gromadzi duże zbiory danych i dlaczego?

Jesienią 2019 roku wybuchła afera z usługą Apple Card: przy rejestracji wystawiała różne limity kredytowe dla mężczyzn i kobiet. Nawet Steve Wozniak nie miał szczęścia:

Rok wcześniej ujawniono, że platforma Netflix pokazuje użytkownikom różne plakaty i teasery, w zależności od ich płci, wieku i narodowości. Za to serwis został oskarżony o rasizm.

Wreszcie Mark Zuckerberg jest regularnie upominany za rzekome gromadzenie, sprzedawanie i manipulowanie danymi swoich użytkowników przez Facebooka. Przez lata był oskarżany, a nawet sądzony za manipulacje podczas amerykańskich wyborów, pomoc rosyjskim służbom specjalnym, podżeganie do nienawiści i radykalnych poglądów, niewłaściwą reklamę, wyciek danych użytkowników, utrudnianie śledztw przeciwko pedofilom.

Post na Facebooku autorstwa Zucka

Jednocześnie serwis internetowy Pornhub co roku publikuje raporty o tym, jakiego rodzaju pornografii szukają ludzie różnych narodowości, płci i wieku. I z jakiegoś powodu nikomu to nie przeszkadza. Chociaż wszystkie te historie są podobne: w każdej z nich mamy do czynienia z dużymi danymi, które w XIX wieku nazywane są „nową ropą”.

Co to są duże dane

Big data – to także big data (ang. big data) lub metadane – to tablica danych, która napływa regularnie iw dużych ilościach. Są one gromadzone, przetwarzane i analizowane, w wyniku czego powstają przejrzyste modele i wzorce.

Uderzającym przykładem są dane z Wielkiego Zderzacza Hadronów, które napływają w sposób ciągły iw dużych ilościach. Z ich pomocą naukowcy rozwiązują wiele problemów.

Ale big data w sieci to nie tylko statystyki do badań naukowych. Można je wykorzystać do śledzenia, jak zachowują się użytkownicy różnych grup i narodowości, na co zwracają uwagę i jak wchodzą w interakcję z treściami. Czasami w tym celu dane są zbierane nie z jednego źródła, ale z kilku, porównując i identyfikując określone wzorce.

O tym, jak ważne są duże dane w sieci, zaczęto mówić, gdy było ich naprawdę dużo. Na początku 2020 roku na świecie było 4,5 miliarda internautów, z czego 3,8 miliarda było zarejestrowanych w sieciach społecznościowych.

Kto ma dostęp do Big Data

Według badań ponad połowa naszych krajów uważa, że ​​ich dane w sieci są wykorzystywane przez osoby trzecie. Jednocześnie wielu publikuje dane osobowe, zdjęcia, a nawet numer telefonu w sieciach społecznościowych i aplikacjach.

Kto gromadzi duże zbiory danych i dlaczego?
Kto gromadzi duże zbiory danych i dlaczego?
Kto gromadzi duże zbiory danych i dlaczego?
Kto gromadzi duże zbiory danych i dlaczego?

Tu trzeba to wyjaśnić: pierwszą osobą jest sam użytkownik, który umieszcza swoje dane w dowolnym zasobie lub aplikacji. Jednocześnie wyraża zgodę (stawia haczyk w umowie) na przetwarzanie tych danych druga strona – czyli właściciele zasobu. Strona trzecia to osoba, której właściciele zasobu mogą przekazywać lub sprzedawać dane użytkownika. Często jest to zapisane w umowie użytkownika, ale nie zawsze.

Strona trzecia to agencje rządowe, hakerzy lub firmy, które kupują dane w celach komercyjnych. Ci pierwsi mogą uzyskać dane na mocy decyzji sądu lub organu wyższego rzędu. Hakerzy oczywiście nie korzystają z żadnych uprawnień – po prostu włamują się do baz danych przechowywanych na serwerach. Firmy (zgodnie z prawem) mogą uzyskać dostęp do danych tylko wtedy, gdy sam im na to pozwoliłeś – zaznaczając pole pod umową. W przeciwnym razie jest to nielegalne.

Dlaczego firmy wykorzystują Big Data?

Big data w dziedzinie komercyjnej jest wykorzystywana od dziesięcioleci, po prostu nie była tak intensywna jak teraz. Są to np. zapisy z kamer monitoringu, dane z nawigatorów GPS czy płatności online. Teraz, wraz z rozwojem sieci społecznościowych, usług i aplikacji online, wszystko to można połączyć i uzyskać najbardziej kompletny obraz: gdzie mieszkają potencjalni klienci, co lubią oglądać, gdzie jeżdżą na wakacje i jaką markę mają samochodu.

Z powyższych przykładów jasno wynika, że ​​za pomocą big data firmy chcą przede wszystkim targetować reklamy. To znaczy oferować produkty, usługi lub indywidualne opcje tylko właściwym odbiorcom, a nawet dostosowywać produkt do konkretnego użytkownika. Do tego reklama na Facebooku i innych dużych platformach staje się coraz droższa, a pokazywanie jej wszystkim po kolei nie jest wcale opłacalne.

Informacje o potencjalnych klientach z otwartych źródeł są aktywnie wykorzystywane przez firmy ubezpieczeniowe, prywatne kliniki i pracodawców. Ci pierwsi mogą np. zmienić warunki ubezpieczenia, jeśli zobaczą, że często szukasz informacji o określonych chorobach lub lekach, a pracodawcy mogą ocenić, czy nie masz skłonności do konfliktów i zachowań antyspołecznych.

Ale jest jeszcze jedno ważne zadanie, z którym borykano się w ostatnich latach: zbliżyć się do najbardziej wypłacalnej publiczności. Nie jest to takie proste, choć zadanie znacznie ułatwiają usługi płatnicze i czeki elektroniczne za pośrednictwem jednego OFD (operatora danych fiskalnych). Aby zbliżyć się jak najbliżej, firmy próbują nawet wytropić i „wychować” potencjalnych klientów od dzieciństwa.: poprzez gry online, interaktywne zabawki i usługi edukacyjne.

Jak to działa?

Największe możliwości gromadzenia danych mają globalne korporacje, które posiadają kilka usług jednocześnie. Facebook ma obecnie ponad 2,5 miliarda aktywnych użytkowników. Jednocześnie firma posiada również inne serwisy: Instagram – ponad 1 miliard, WhatsApp – ponad 2 miliardy i inne.

Ale Google ma jeszcze większy wpływ: Gmail jest używany przez 1,5 miliarda ludzi na świecie, kolejne 2,5 miliarda przez mobilny system operacyjny Android, ponad 2 miliardy przez YouTube. I to nie licząc wyszukiwarek Google i aplikacji Google Maps, sklepu Google Play i przeglądarki Chrome. Pozostaje zapiąć bank internetowy – a Google będzie mógł wiedzieć o Tobie dosłownie wszystko. Nawiasem mówiąc, Yandex jest już o krok do przodu pod tym względem, ale obejmuje tylko rosyjskojęzyczną publiczność.



>> Przede wszystkim firmy są zainteresowane tym, co publikujemy i lubimy w sieciach społecznościowych. Na przykład, jeśli bank zobaczy, że jesteś żonaty i aktywnie lubisz dziewczyny na Instagramie lub Tinderze, jest bardziej prawdopodobne, że zatwierdzisz kredyt konsumencki. A hipoteka na rodzinę zniknęła.

Ważne jest również, w jakie reklamy klikasz, jak często iz jakim skutkiem.

(Ie Kolejnym krokiem są wiadomości prywatne: zawierają one znacznie więcej informacji. Wiadomości wyciekły na VKontakte, Facebook, WhatsApp i inne komunikatory internetowe. Według nich, nawiasem mówiąc, łatwo jest śledzić geolokalizację w momencie wysłania wiadomości. Na pewno zauważyłeś: kiedy rozmawiasz z kimś o zakupie lub po prostu zamówieniu pizzy, w kanale natychmiast pojawia się odpowiednia reklama.

🚕 Duże zbiory danych są aktywnie wykorzystywane i „wyciekają” przez firmy kurierskie i taksówkarskie. Wiedzą, gdzie mieszkasz i pracujesz, co kochasz, jakie są Twoje przybliżone dochody. Na przykład Uber pokazuje wyższą cenę, jeśli jedziesz do domu z baru i oczywiście przesadza. A kiedy masz w telefonie kilka innych agregatorów, wręcz przeciwnie, będą oferować tańsze.

(Ie Istnieją usługi, które wykorzystują zdjęcia i filmy, aby zebrać jak najwięcej informacji. Na przykład biblioteki wizji komputerowej – Google ma jedną. Skanują Ciebie i Twoje otoczenie, aby zobaczyć, jaki masz rozmiar lub wzrost, jakie marki nosisz, jakim samochodem jeździsz, czy masz dzieci lub zwierzęta.

(Ie Ci, którzy dostarczają bramki SMS do banków do swoich wysyłek, mogą śledzić twoje zakupy na karcie – znając ostatnie 4 cyfry i numer telefonu – a następnie sprzedać te dane komuś innemu. Stąd cały ten spam ze zniżkami i pizzą w prezencie.

🤷️️ W końcu sami wyciekamy nasze dane do lewych usług i aplikacji. Pamiętaj o tym szumie wokół Getcontact, kiedy każdy chętnie wpisywał swój numer telefonu, aby dowiedzieć się, jak został napisany przez innych. A teraz znajdź ich zgodę i przeczytaj, co mówi o przekazywaniu Twoich danych (spoiler: właściciele mogą przekazywać je osobom trzecim według własnego uznania):

Kto gromadzi duże zbiory danych i dlaczego?

Korporacje mogą z powodzeniem gromadzić, a nawet sprzedawać dane użytkowników przez lata, aż dojdzie do procesu sądowego – jak to się stało z tym samym Facebookiem. I wtedy decydującą rolę odegrało naruszenie przez firmę RODO – prawa w UE, które znacznie bardziej restrykcyjnie niż amerykańskie ogranicza wykorzystanie danych. Innym niedawnym przykładem jest skandal związany z oprogramowaniem antywirusowym Avast: jedna z usług zależnych firmy gromadziła i sprzedawała dane od 100 do 400 milionów użytkowników.

Ale czy to wszystko ma dla nas jakieś zalety?

Jak duże zbiory danych pomagają nam wszystkim?

Tak, jest też jasna strona.

Big data pomaga łapać przestępców i zapobiegać atakom terrorystycznym, znajdować zaginione dzieci i chronić je przed niebezpieczeństwem.

Z ich pomocą my otrzymujemy fajne oferty od banków i osobiste rabaty. Dzięki nim my nie płacimy za wiele serwisów i portali społecznościowych, które zarabiają tylko na reklamach. Inaczej sam Instagram kosztowałby nas kilka tysięcy dolarów miesięcznie.

Sam Facebook ma 2,4 miliarda aktywnych użytkowników. Jednocześnie ich zysk za 2019 rok wyniósł 18,5 mld dolarów. Okazuje się, że dzięki reklamom firma zarabia do 7,7 USD rocznie od każdego użytkownika.

Wreszcie, czasami jest to po prostu wygodne: gdy służby już wiedzą, gdzie jesteś i czego chcesz, a Ty nie musisz sam szukać potrzebnych informacji.

Kolejnym obiecującym obszarem zastosowań Big Data jest edukacja.

Na jednym z amerykańskich uniwersytetów w Wirginii przeprowadzono badanie mające na celu zebranie danych o studentach z tzw. grupy ryzyka. To ci, którzy słabo się uczą, opuszczają zajęcia i są na skraju odpadnięcia. Faktem jest, że w stanach co roku odlicza się około 400 osób. To źle zarówno dla uczelni, które mają obniżone oceny i finansowanie, jak i dla samych studentów: wielu zaciąga kredyty na edukację, które po odliczeniu i tak trzeba będzie spłacić. Nie mówiąc już o straconym czasie i perspektywach kariery. Z pomocą dużych zbiorów danych można zidentyfikować zaległości w czasie i zaoferować im korepetytora, dodatkowe zajęcia i inną ukierunkowaną pomoc.

To zresztą sprawdza się też w szkołach: wtedy system powiadomi nauczycieli i rodziców – mówią, dziecko ma problemy, pomóżmy mu razem. Big Data pomoże Ci również zrozumieć, które podręczniki sprawdzają się lepiej i którzy nauczyciele łatwiej objaśniają materiał.

Kolejnym pozytywnym przykładem jest profilowanie kariery.: wtedy nastolatkom pomaga się zdecydować o ich przyszłym zawodzie. Tutaj big data pozwala na zbieranie informacji, których nie da się uzyskać za pomocą tradycyjnych testów: jak zachowuje się użytkownik, na co zwraca uwagę, jak wchodzi w interakcję z treścią.

W tym samym USA istnieje program poradnictwa zawodowego – SC ACCELERATE. Wykorzystuje między innymi technologię CareerChoice GPS: analizuje dane o charakterze studentów, ich upodobaniach do przedmiotów, mocnych i słabych stronach. Dane są następnie wykorzystywane, aby pomóc nastolatkom wybrać odpowiednie dla nich uczelnie.


Subskrybuj i śledź nas na Yandex.Zen — technologia, innowacje, ekonomia, edukacja i udostępnianie w jednym kanale.

Dodaj komentarz