Journal of Clinical Healthcare (JCHC)
1-5 3 Journal of Clinical Healthcare 3/2018 wykraczają poza tradycyjne modele statystyczne. W celu ich aplikacji, wykorzystuje się systemy o dużej mocy obliczeniowej. Kluczową różnicą pomiędzy analizą dużych skupisk danych, a podejściem tradycyjnym, jest brak uprzednio postawionej hipotezy, która następnie podlega weryfikacji. „Nowe metody badawcze przekładają nacisk z poszukiwania przyczynowości na analizę korelacji” [3]. Bez znajomości podstaw i przyczyn zjawiska. Zastępują pytanie dlaczego? pytaniem co?. Obecnie przyczynowość spadła z piedestału głównego zainteresowania, ale z niej nie zrezygnowano (tabela 1). Tabela 1. Różnice pomiędzy tradycyjnym, a nowym podejściem analizy danych Opracowane własne na podstawie [3-5] Sposób analizowania danych Opis metody Tradycyjny Analogowa metoda gromadzenia danych; stawianie hipotezy przed zebraniem informacji; poszukiwanie przyczynowości i odpowiedzi na pytania dlaczego?; zależności liniowe Kontekst Big Data Masowe gromadzenie informacji z wielu źródeł, wykorzystanie nowoczesnych algorytmów, nacisk na analizę korelacji i odpowiedzi na pytanie co?; zależności nieliniowe, analiza real-time Koncepcja Big Data pozwala na wielowątkową analizę danych pochodzących z różnych źródeł, której głównym przedmiotem zainteresowania jest człowiek. Metoda w głównej mierze opiera się na przewidywaniu ludzkich zachowań oraz środowiska wokół. Każdy z nas posiada skończoną liczbę reakcji, które można zapisać i scharakteryzować, dotyczy to także środowiska naturalnego. Określenie działań jest możliwe poprzez sygnały, które ludzie za sprawą różnych czynności wysyłają świadomie lub nieświadomie. Istnieją jednak ograniczenia z uwagi na dużą losowość i wypadkowość ludzkich poczynań. W literaturze pojęciowej wszystkie powstałe zakłócenia i przeciwności opisuje się mianem szumu (ang. noise). W chwili obecnej nie scharakteryzowano jeszcze granicy przewidywalności, ponieważ współczesne badania na temat określania zachowań widnieją jeszcze w początkowej fazie badawczej, ale istnieją już pierwsze przykłady ich zastosowań. Do tego zjawiska odnosi się na przykład tzw. „ciąża w markecie”. W jednej z sieci amerykańskich supermarketów regularne zakupy robiła cała rodzina. W pewnym momencie ojciec rodu zaczął się zastanawiać, dlaczego do swojej skrzynki na listy od pewnego czasu zaczął otrzymywać reklamy produktów dla niemowlaków. Poirytowany tym faktem zarządzał wyjaśnień od sieci supermarketów, w której robili zakupy, a której ulotki otrzymywał ojciec. Wyjaśnienie było nie tylko zaskakujące dla samego ojca, ale i osób postronnych. Otóż córka, która robiła zakupy w tym hipermarkecie zaczęła kupować szampony i inne środki higieny osobistej, które posiadały delikatniejszy zapach niż dotychczas. System marketingowy sklepu zauważył tą różnice i połączył z faktem, że kobietom, które zachodzą w ciąże wyostrza się węch, z tego powodu wybierają delikatniejsze zapachy kosmetyków. W przedstawionej sytuacji system komputerowy szybciej wiedział o ciąży nastolatki, a niżeli sam ojciec, który nie został w tym czasie jeszcze poinformowany. Kwintesencją analizy dużych ilości danych jest porównywanie informacji zgormadzonych przez system z innymi osobami w grupie. Ogólnie rzecz ujmując im większa próba wykorzystywana do analizy tym większe szanse na odnalezienie określonych wzorców. Pojedyncze informacje behawioralne nie są w stanie zwizualizować konkretnych zależności pomiędzy zrachowaniami jednostek, a ich przyszłymi celami, czy zdarzeniami [6,7]. Dane osobowe zbierane przy pomocy współczesnych technologii mogą być wykorzystywane w każdej dziedzinie naszego życia. Niektóre odkrycia mogą być niezwykle zaskakujące i mogą prowadzić do nowych niespotykanych wcześniej wzorców lub podważać utarte przekonania. Zupełnym zaskocze- niem dla opinii publicznej były badania przeprowadzone prze duńskich naukowców nad kore- lacją pomiędzy występowaniem raka centralnego układu nerwowego. Okazało się, że dokonana analiza dużych danych wykazała, że taka zależność nie występuje. Dojście do otrzymanych rezultatów było możliwe głównie za sprawą łączenia istniejących danych oraz wykorzystania nowoczesnych analiz Big Data. Badana grupa obejmowała niemalże całą populację, a było to możliwe ze względu na skrupulatność Duńczyków w prowadzeniu rejestrów osób chorujących na raka, rejestrów poziomu wykształcenia i dochodów oraz danych udostępnio- nych o klientach przez operatorów komórkowych. Mimo skali badań, wszystkie dane zostały precyzyjnie uporządkowane, a wnioski płynące z wyników przyczyniły się do uzyskania bardzo cennej wiedzy
Made with FlippingBook
RkJQdWJsaXNoZXIy MzM5OTk=