Journal of Clinical Healthcare (JCHC)
10-14 13 Journal of Clinical Healthcare 3/2018 Drugim rodzajem są źródła zewnętrzne np. informacje rządowe, laboratoria, apteki, instytucje ubezpieczeniowe itp. {2} W ramach kolejnej kategorii wyróżniamy różne formaty np. kartotekowe bazy danych, .csv, ASCII/ tekst itd, bądź różne lokacje zarówno geograficzne jak i różne strony internetowe świadczeniodawców. {3} Odrębnym i zarazem ostatnim wariantem są róż- ne aplikacje np. bazy danych, aplikacje przetwa- rzające transakcje itp. {4} Do źródeł danych zalicza się także wszelkie strony internetowe i portale społecznościowe oraz aplikacje mobilne. {5} uwagi na rosnącą popularność wymienionych źródeł cyfrowych przewiduje się, że w przyszłości będą one zyskiwać na znaczeniu. Jednak przeszkodą w ich stosowaniu na użytek publiczny i do badań naukowych jak i komercyjny, może być stan właści- cielski i fakt, że są one najczęściej usługami prywatnymi. W przyszłości dużą rolę będzie odgrywał też wspomniany wcześniej Internet Rzeczy. {6} Umożliwi on gromadzenie danych maszynowych, odczytów z urządzeń sensorycznych i systemów mierzących funkcje życiowe. (tabela 1) II. Etap wstępnej obróbki i Transformacji W ramach dalszych etapów obróbki danych należy wspomnieć również o oprogramowaniu pośredni- czącym (ang. middleware), które jest częścią procesu pozyskiwania i przetwarzania danych. W tym wypadku będą to tzw. ETL, (ang. extract transform load), hurtownie danych, tradycyjne formaty typu CSV oraz tabele. [4-8] III. Etap Wstępnej obróbki i Transformacji Nieodłącznym elementem na drodze do poznania nowej wiedzy, będą też platformy i narzędzia do Big Data takie jak: Hadoop, MapReduce, Pig, Hive, Jaql, Zookeeper, HBase, Cassandra, Oozie, Avro, Mahout oraz wiele innych rozwiązań.[4-9] IV. Etap Ekploracji danych oraz Interpretacji i Ewaluacji Ostatecznym etapem, który wymaga odpo- wiednich technik i oprogramowania jest proces przekształcania danych w informacje, a informacje w wiedzę. Najczęściej zdefiniowany etap jest określany mianem Business Intelligence (BI). To moment, w którym wykorzystuje się szereg narzędzi anali- tycznych takich jak OLAP czy eksploracja danych do pozyskania wiedzy, a także raporty, prezentacje, czy wizualizacje obrazkowe do przekazania informacji. Popularnym narzędziami są również gotowe oprogra- mowania, zawierające wszystkie niezbędne procesy i narzędzia w ramach dostarczonej usługi. W tej chwili najczęściej używane to Teradata czy IBM DB2, natomiast popularność zyskują rozwiązania chmu- rowe. [1,4-9] Tabela 1. Grupy źródeł i narzędzi kluczowych do analizy Big Data Opracowanie własne na podstawie [4,5,8,9] I. Źródła surowych danych dla ochrony zdrowia II. Oprogramowa nie pośredniczące III. Narzędzia i platformy do Big Data IV. Oprogramowa nie analityczne i prezentacja {1} Wewnętrzne: Elektroniczne rekordy zdrowotne; Kliniczne systemy wsparcia; {2} Zewnętrzne: informacje rządowe, laboratoriów, aptek, instytucji ubezpieczeń; {3} Różne formaty: kartotekowe bazy danych; Różne lokacje: geograficzne, strony internetowe świadczeniodawc ów {4} Różne aplikacje: aplikacje przetwarzające transakcje, bazy danych {5} Strony internetowe; Portale społecznościowe; Aplikacje mobile; {6} Internet Rzeczy; ETL; Hurtownie danych; CSV; Tabele; Hadoop; MapReduc e; Pig; Hive; Jaql; Zookeeper ; HBase; Cassandra ; Oozie; Avro; Mahout; Analityka: Teradata; IBM DB2; IBM SPSS; Rozwiązania chmurowe; Prezentacja: Raporty; Prezentacje; Wizualizacje;
Made with FlippingBook
RkJQdWJsaXNoZXIy MzM5OTk=