Jak duże zbiory danych pomagają w walce z pandemią

W jaki sposób analiza Big Data może pomóc w pokonaniu koronawirusa i jak technologie uczenia maszynowego pozwalają nam analizować ogromne ilości danych? Odpowiedzi na te pytania szuka Nikolai Dubinin, gospodarz kanału Youtube Industry 4.0.

Analiza dużych zbiorów danych to jeden z najpotężniejszych sposobów śledzenia rozprzestrzeniania się wirusa i pokonania pandemii. 160 lat temu wydarzyła się historia, która dobitnie pokazała, jak ważne jest zbieranie danych i szybkie ich analizowanie.

Mapa rozprzestrzeniania się koronawirusa w Moskwie i regionie moskiewskim.

Jak to się wszystko zaczęło? 1854 Londyńska dzielnica Soho zostaje dotknięta epidemią cholery. 500 osób umiera w ciągu dziesięciu dni. Nikt nie rozumie źródła rozprzestrzeniania się choroby. W tamtych czasach wierzono, że choroba jest przenoszona w wyniku wdychania niezdrowego powietrza. Wszystko zmieniło doktora Johna Snowa, który stał się jednym z twórców współczesnej epidemiologii. Zaczyna przeprowadzać wywiady z okolicznymi mieszkańcami i umieszcza na mapie wszystkie zidentyfikowane przypadki choroby. Statystyki wykazały, że większość zmarłych znajdowała się w pobliżu hydrantu na Broad Street. To nie powietrze, ale woda zatruta ściekami spowodowała epidemię.

Serwis Tectonix pokazuje na przykładzie plaży w Miami, jak tłumy mogą wpływać na rozprzestrzenianie się epidemii. Mapa zawiera miliony anonimowych danych z geolokalizacją pochodzących ze smartfonów i tabletów.

A teraz wyobraźcie sobie, jak szybko koronawirus rozprzestrzenia się po naszym kraju po korku w moskiewskim metrze 15 kwietnia. Wtedy policja sprawdzała cyfrową przepustkę każdej osoby, która zjechała do metra.

Po co nam przepustki cyfrowe, skoro system nie radzi sobie z ich weryfikacją? Są też kamery monitoringu.

Według Grigorija Bakunowa, dyrektora ds. rozpowszechniania technologii w Yandex, działający obecnie system rozpoznawania twarzy rozpoznaje 20-30 fps na jednym komputerze. Kosztuje około 10 dolarów. W tym samym czasie w Moskwie jest 200 kamer. Aby to wszystko działało w trybie rzeczywistym, trzeba zainstalować około 20 tysięcy komputerów. Miasto nie ma takich pieniędzy.

W tym samym czasie 15 marca w Korei Południowej odbyły się wybory parlamentarne offline. Frekwencja na przestrzeni ostatnich szesnastu lat była rekordowa – 66%. Dlaczego nie boją się zatłoczonych miejsc?

Korei Południowej udało się odwrócić rozwój epidemii w kraju. Podobne doświadczenia mieli już za sobą: w 2015 i 2018 r., kiedy w kraju wybuchły ogniska wirusa MERS. W 2018 roku wzięli pod uwagę błędy sprzed trzech lat. Tym razem władze działały szczególnie zdecydowanie i połączyły duże zbiory danych.

Ruchy pacjenta monitorowano za pomocą:

  • nagrania z kamer monitoringu

  • transakcje kartą kredytową

  • Dane GPS z samochodów obywateli

  • Telefony komórkowe

Ci, którzy byli na kwarantannie, musieli zainstalować specjalną aplikację, która ostrzegała władze o gwałcicielach. Można było zobaczyć wszystkie ruchy z dokładnością do minuty, a także dowiedzieć się, czy ludzie noszą maski.

Grzywna za naruszenie wyniosła do 2,5 tys. dolarów. Ta sama aplikacja powiadamia użytkownika, jeśli w pobliżu znajdują się zarażone osoby lub tłum ludzi. Wszystko to odbywa się równolegle z masowymi testami. Codziennie w kraju wykonywano do 20 testów. Powstały 633 ośrodki przeznaczone wyłącznie do wykonywania testów na obecność koronawirusa. Na parkingach znajdowało się również 50 stanowisk, w których można było przystąpić do testu bez wychodzenia z samochodu.

Ale, jak słusznie zauważa dziennikarz naukowy i twórca portalu naukowego N+1 Andrey Konyaev, Pandemia minie, ale dane osobowe pozostaną. Państwo i korporacje będą mogły śledzić zachowanie użytkowników.

Nawiasem mówiąc, według najnowszych danych, koronawirus okazał się bardziej zaraźliwy, niż myśleliśmy. To oficjalne badanie przeprowadzone przez chińskich naukowców. Okazało się, że COVID-19 może przenosić się z jednej osoby na pięć lub sześć osób, a nie dwie lub trzy, jak wcześniej sądzono.

Wskaźnik infekcji grypą wynosi 1.3. Oznacza to, że jedna chora osoba zaraża jedną lub dwie osoby. Początkowy współczynnik zarażenia koronawirusem wynosi 5.7. Śmiertelność z powodu grypy wynosi 0.1%, z powodu koronawirusa – 1-3%.

Dane prezentowane są według stanu na początek kwietnia. Wiele przypadków pozostaje niezdiagnozowanych, ponieważ dana osoba nie jest testowana na obecność koronawirusa lub choroba przebiega bezobjawowo. Dlatego w tej chwili nie można wyciągać wniosków na temat liczb.

Technologie uczenia maszynowego najlepiej radzą sobie z analizą ogromnej ilości danych i pomagają nie tylko śledzić ruchy, kontakty, ale także:

  • zdiagnozować koronawirusa

  • poszukaj lekarstwa

  • poszukaj szczepionki

Wiele firm zapowiada gotowe rozwiązania oparte na sztucznej inteligencji, które automatycznie wykryją koronawirusa nie na podstawie analizy, ale np. prześwietlenia lub tomografii komputerowej płuc. W ten sposób lekarz zaczyna natychmiast pracować z najpoważniejszymi przypadkami.

Ale nie każda sztuczna inteligencja ma wystarczającą inteligencję. Pod koniec marca media obiegła wiadomość, że nowy algorytm z dokładnością do 97% może wykryć koronawirusa na podstawie prześwietlenia płuc. Okazało się jednak, że sieć neuronowa została wytrenowana tylko na 50 zdjęciach. To o 79 zdjęć mniej niż potrzebujesz, aby zacząć rozpoznawać chorobę.

DeepMind, oddział Alphabet, firmy macierzystej Google, chce całkowicie odtworzyć białkową strukturę wirusa za pomocą sztucznej inteligencji. Na początku marca DeepMind powiedział, że jego naukowcy zrozumieli strukturę białek związanych z COVID-19. Pomoże to zrozumieć, jak działa wirus i przyspieszy poszukiwanie lekarstwa.

Co jeszcze do poczytania na ten temat:

  • Jak technologia przewiduje pandemie
  • Kolejna mapa koronawirusa w Moskwie
  • Jak sieci neuronowe nas śledzą?
  • Świat po koronawirusie: czy czeka nas epidemia lęków i depresji?

Subskrybuj i śledź nas na Yandex.Zen — technologia, innowacje, ekonomia, edukacja i udostępnianie w jednym kanale.

Dodaj komentarz