Journal of Clinical Healthcare (JCHC)

6-9 8 Journal of Clinical Healthcare 3/2018 staje się coraz bardziej skomplikowane i wymagające. [4-7] Niektórzy naukowcy i badacze postulują jednak poszerzenie tego zbioru o kolejne pojęcie Veracity, czyli wiarygodność. Oznacza to, że wyniki i analizy są wiarygodne i wolne od wszelkich błędów, które mogłyby zaszkodzić ostatecznemu rezultatowi. Pozycja ta jest szczególnie istotna w ochronie zdro- wia, gdzie często na podstawie wydobytych informacji podejmuje się ostateczne decyzje o charakterze życia lub śmierci.[4,6-8] Tabela 1. Charakterystyka Big Data według 4V [Opracowanie własne na podstawie 4-8] Lp. Pojęcie Tłum. angielskie Opis 1. Obojętność Volume Duża liczba oraz wielkość gromadzonych danych 2. Dynamika Velocity Pobieranie danych w czasie rzeczywistym 3. Zróżnicowanie Variety Charakter strukturalny danych i multimedia 4. Wiarygodność Veracity Dane są wolne od wad Naszym zdaniem należy również rozwinąć niezbędne pojęcia nierozłącznie związane z Big Data, których przybliżenie pozwoli na głębsze zaznajomienie się z omawianą tematyką, są to min.: samouczenie się maszyn, ekploracja dantych, eksploracja tekstu, hurtownia danych, Internet Rzeczy oraz obliczenia w chmurze. Dokładniejsze omówienie ostatniego wątku nastąpi w dalszej części pracy, bowiem stanowi on najbardziej istotny punkt rozwoju polskiego systemu informacji medycznej. Samouczenie się maszyn (ang. maschine learning) to dział wywodzący się z nauk zajmujących się sztuczną inteligencją (SI). Głównym zadaniem teorii jest wykorzystanie wiedzy z zakresu SI do opracowania samodzielnego systemu, opierającego się o analizę zgromadzonej wiedzy z doświadczeń (danych) uzyskanych na drodze swojej aktywności. Zastosowanie tej metodologii jest szerokie i obejmuje działy ekonomii, chemii czy medycyny, w których liczba przetwarzanych danych wykracza poza możliwości klasycznych systemów [3,9]. Pojęcie eksploracji danych (ang. data mining) może być zdefiniowane jako proces pozyskiwania wiedzy bądź informacji z dużego zasobu danych [10]. Data mining jest jedną z możliwości otrzymywania wiedzy z rozległych baz danych. Celem eksploracji jest przekształcenie danych faktycznych, tekstowych czy numerycznych w informacje. W procesie wykorzystuje się pojedyncze lub kombinowane algorytmy, które co istotne muszą same rozpoznać przetwarzane struktury danych. Eksploracja tekstu polega na maszynowym przeobra- żeniu nieustrukturyzowanego tekstu, pozyskania z niego znaczeń i przekonwertowaniu na informację ustrukturyzowaną. Następnie wyniki są analizowane bardziej tradycyjnymi metodami. Większość metod eksploracji tekstu wywodzi się z metod przetwarzania języka naturalnego [4-6,10,11]. Hurtownie danych (HD) (ang. data warehouse) są „ złożonymi systemami informatycznymi, które przetwarzają i łączą dane pochodzące z różnych źródeł w unifikowane struktury, aby nadać im jakość i formę niezbędną dla celów analitycznych ” [13]. Z uwagi na tak określoną definicję można zauważyć, że HD są abstrakcyjną złożoną strukturą, która może być narzędziem wykorzystywanym przez stanowiska kierownicze lub analityków do podejmowania okre- ślonych decyzji [6-8,11]. Internet Rzeczy (ang. Internet of Things) jest całkowicie nową koncepcją nieposiadającą jeszcze ściśle zdefiniowanego znaczenia. Opiera się ona na integracji wirtualnego świata informacji z obiektami świata rzeczywistego poprzez dołączenie do interentu nie tylko komputerów, ale także innych urządzeń lub obiektów. Przykładem mogą być urządzenia RFID (Radio Frequency Identification), urządzenia ku- chenne czy akcesoria odzieżowe (ang. wearables) [4]. Ostatnimi elementami poświęconymi definicjom są pojęcia przetwarzania danych, danych osobowych oraz wrażliwych. Według ustawy o ochronie danych osobowych, przez przetwarzanie danych rozumie się jakiekolwiek operacje wykonywane nadanych osobo- wych, takie jak zbieranie, utrwalanie, przechowy- wanie, opracowywanie, zmienianie, udostępnianie i usuwanie, a zwłaszcza te, które wykonuje się w systemach informatycznych [12]. Ta sama ustawa definiuje dane osobowe w art. 1 i dane szczególnie chronione, co do których odnosi się artykuł 27 pkt. 1 tego aktu prawnego, których przetwarzanie jest regulowane przez pkt. 2 art. 27. „Art. 6. 1. W rozumieniu ustawy za dane osobowe uważa się wszelkie informacje dotyczące ziden- tyfikowanej lub możliwej do zidentyfikowania osoby fizycznej.

RkJQdWJsaXNoZXIy MzM5OTk=