KMD - Krajowy Magazyn Danych

Krajowy Magazyn Danych

infrastruktura dla składowania i udostępniania danych oraz efektywnego przetwarzania dużych wolumenów danych w modelach HPC, BigData i sztucznej inteligencji

Usługi

Składowanie danych

Obiektowe

Plikowe

Hierarchiczne

Niezawodne

Repozytoria danych

EOSC – otwarty dostęp

Kompatybilny z FAIR

Przetwarzanie danych niestrukturalnych

Bezpieczeństwo danych

Szyfrowanie danych

Repliki geograficzne

Niezawodne składowanie z redundancją

Analityka BIG DATA

Sztuczna inteligencja

Model Data Lake

Środowiska HPC i chmura

Przetwarzanie brzegowe

Cennik usług

Usługi

Składowanie danych

Obiektowe

Plikowe

Hierarchiczne

Niezawodne

Bezpieczeństwo danych

Szyfrowanie danych

Repliki geograficzne

Niezawodne składowanie z redundancją

Analityka BIG DATA

Sztuczna inteligencja

Model Data Lake

Środowiska HPC i chmura

Przetwarzanie brzegowe

Repozytoria danych

EOSC – otwarty dostęp

Kompatybilny z FAIR

Przetwarzanie danych niestrukturalnych

Cennik usług

O projekcie

Koncepcja KMD obejmuje fundamentalną przebudowę architektury do postaci otwartego, modularnego, rozszerzalnego oraz zdecentralizowanego i skalowalnego magazynu danych, wyposażonego w szereg interfejsów dostępowych oraz zintegrowanych usług i aplikacji, w tym mechanizmów wspomagających efektywne składowanie i dostęp do danych (wielopunktowa obsługa I/O, buforowanie), długoterminowe zarządzanie danymi, ich eksplorację, analizę i efektywne przetwarzanie.

Otwarta architektura systemu KMD zapewni możliwość dalszego rozszerzania funkcjonalności i dodawania kolejnych protokołów i interfejsów dostępowych do danych, np. usług prezentacji danych, usług do obróbki danych, aplikacji analitycznych czy mechanizmów integracji z systemami przetwarzania danych.

Usługi podstawowe systemu zapewnią możliwość przechowywania i zabezpieczania danych (fizycznego i logicznego), natomiast usługi dodatkowe, osadzone w systemie oraz usługi dostępowe umożliwią realizację zaawansowanych systemów, usług i aplikacji dano-centrycznych, w ramach których wymagane jest wydajne i bezpieczne składowanie, dostęp i przetwarzanie oraz zarządzanie dużymi i złożonymi wolumenami danych.

Technologie

Przetwarzanie brzegowe (edge computing)
Reguły dostępu FAIR, zgodność z EOSC
Model Data Lake
Elementy AI w analityce danych

Architektura

EDGE COMPUTING

Przetwarzanie dużych zbiorów danych z rozproszonych źródeł

Wysoki poziom integracji narzędzi przetwarzania i przechowywania

Obróbka danych w czasie rzeczywistym

EDGE COMPUTING

Kliknij by dowiedzieć się więcej

BIG DATA

Efektywne wykorzystanie dużych wolumenów danych w biznesie

Integracja zaawansowanych rozwiązań BIG DATA, AI i ML

Wsparcie małych i średnich przedsiębiorstw

BIG DATA

Kliknij by dowiedzieć się więcej

DATA LAKE

Dynamiczne repozytorium

Przetwarzanie danych nieustrukturyzowanych

Zaawansowana analiza danych historycznych i generowanych w czasie rzeczywistym

DATA LAKE

Kliknij by dowiedzieć się więcej

Infrastruktura

Celem bezpośrednim projektu jest opracowanie i dostarczenie produkcyjnych usług przechowywania, dostępu oraz zabezpieczania danych i zarządzania metadanymi a także integracji rozwiązań dla przetwarzania dużych i złożonych wolumenów danych na bazie rozproszonej infrastruktury. Umożliwi to integrację platform analitycznych oraz rozwiązań z zakresu uczenia maszynowego i sztucznej inteligencji w infrastrukturze danych i ścisłą integrację infrastruktury danych z systemami HPC i HTC w centrach HPC w celu efektywnego przetwarzanie obszernych i złożonych wolumenów i zbiorów danych.

Wskazana Infrastruktura KMD wraz z niezbędną regionalną i ogólnokrajową siecią wsparcia będzie tworzyć krajową platformę przechowywania danych i zostanie utworzona w powiązaniu z istniejącą w Polsce naukowo-badawczą infrastrukturą informatyczną. Utworzona przez konsorcjantów infrastruktura w terminie do końca 2024 podniesie pojemność infrastruktury przechowywania danych o 200 petabajtów oraz pojemność przestrzeni taśmowej o 180 petabajtów, a zastosowany przy jej budowie model Data Lake zapewni jej dużą elastyczność. Ponadto w wyniku projektu do 2024 udostępnione zostaną efektywne ekonomicznie usługi podstawowych procesów przechowywania i zarządzania danymi oraz ich przetwarzania i analityki. Więcej >