Journal of Clinical Healthcare (JCHC)

10-14 12 Journal of Clinical Healthcare 3/2018 aby poprawić i monitorować zdrowie i wiele innych rozwiązań, które zostaną przedstawione w dalszych rozważaniach. Możliwości wykorzystywania nowo- czesnych technologii gromadzenia i przetwarzania danych jest wiele. Nie sposób wymienić wszystkich zastosowań nowej koncepcji do zdobywania wiedzy bez pominięcia czegokolwiek. Oprócz wymienionych prężnie rozwijających się sektorów gospodarczych należy nadmienić też dynamicznie rosnący sektor telekomunikacyjny, obronny, wspomniany już wcześniej marketingowy, technologiczny, a także koncepcji Smart Cities, która skupia miasta skoncen- trowane na zrównoważonym rozwoju i wykorzy- stywania nowoczesnych technologii do bardziej komfortowego i lepszego życia w metropoliach [6-8]. PROCES PRZETWARZANIA WIELKICH BAZ DANYCH Tradycyjne metody do procesu przetwarzania danych często wykorzystują nowe technologie z nowoczesnym oprogramowaniem. Nie inaczej będzie także w przypadku Big Data. Jednak w sytuacji konfrontowania wielkiej liczby danych nie można mówić o prostym procesie przeprowadzanym na komputerze klasy PC z pojedynczym narzędziem do analizy danych. Główną różnicą pomiędzy zwykłym przetwarzaniem informacji, a analizą Big Data jest proces w jaki sposób się to odbywa. Z definicji wielkie bazy danych są bardzo duże i proces przerabiania danych musi zostać podzielony na kilka etapów. Kolejną różnicą jest częste korzystanie z centralnych repozytoriów, aby uzyskać szerszy wgląd na badane korelacje. Dostępne w chmurze platformy typu open source (wolne, bezpłatne oprogramowanie) takie jak Hadoop czy MapReduce pozwalają w pełni wyko- rzystać potencjał Big Data. [1,3,5] Proces wydobywania wiedzy z rozległych zbiorów danych można podzielić na kilka etapów [19], [20]. Wyróżniamy [4-8]:  Selekcja (ang. seleciotn) – Selekcja określo- nych danych nawiązujące do wybranych kryte- riów. Przykład: Posiadane telefony komórkowe przez oso- by, które można w ten sposób zdefiniować  Wstępną obróbkę (ang. preprocessing) – Etap ten polega na początkowej analizie surowych danych pozyskanych z selekcji. Odrzuceniu wszystkich danych, które są zbędne i niepo- trzebne w dalszym etapie. Przykład: Kiedy badana jest zachorowalność na raka prostaty, nie trzeba zaznaczać płci  Transformacje (ang. transformation) – Trans- formacja konkretnych danych, które odpowia- dają kryterium postawionej hipotezy. Określa się tylko taki zakres danych jaki jest nam po- trzebny do badania. Przykład: Dopieramy wiek badanych użyteczny do przebadania konkretnego rynku  Eksploracja danych (ang. data mining) – Na tym etapie następuje proces odkrywania wie- dzy, czyli tworzenie konkretnych wzorów z po- zyskanych danych Przykład: Wykorzystanie algorytmu sztucznych sieci neuronowych do określenia wzorów Interpretacje i ewaluacje (ang. interpretation and evaluation) – Wszystkie znaczące wzorce, które zostały wyodrębnione w poprzednim punkcie zostają zinterpretowane. Wiedza zdobyta w ten sposób może być wykorzystana do podjęcia konkretnych decyzji. Rycina 1. Etapy procesu odkrywania wiedzy [4-8] Omówione powyżej etapy procesu wymagają odpo- wiednich instrumentów oraz źródeł w celu ich rea- lizacji. Można wyodrębnić cztery główne grupy narzę- dzi, które stanowią bazę do realizacji powyższych procesów. Nie da się jednoznacznie określić granic poszczególnych etapów, bowiem działania mogą zachodzić równolegle.[4,5] Jednak przybliżony sche- mat został podany poniżej. I. Etap Selekcji – wyodrębnienie źródeł danych Istotnym zagadnieniem w procesie przetwarzania dużych baz danych jest ich pozyskiwanie. Na tle obecnego tematu wyznaczenie źródeł informacji, zostanie ograniczone do ochrony zdrowia. Źródła surowych danych można podzielić na kilka rodzajów. Pierwszą kategorią są wewnętrzne bazy danych np. elektroniczne rekordy zdrowotne (EHR) lub kliniczne systemy wsparcia np. CPOE {1}.

RkJQdWJsaXNoZXIy MzM5OTk=