Ponad 90 proc. wszystkich danych wytworzonych na całym globie powstało w ciągu ostatnich dwóch lat. Niektóre przedsiębiorstwa, takie jak np. Met Office, brytyjski narodowy serwis meteorologiczny, przechowują na swoich nośnikach 60 PB danych, przetwarzając dziennie ok. 1 PB. To liczby, które dziś szokują, ale już wkrótce nie będą robić na nikim większego wrażenia.

Analitycy z IDC straszą, że w 2025 r. ilość przetwarzanych danych wyniesie 163 ZB – dziesięciokrotnie więcej niż rok temu. Taki stan rzeczy nie pozostaje bez wpływu na budżety przeznaczone na informatykę. Wprawdzie cena za 1GB powierzchni dyskowej spada, a poza tym istnieje alternatywa w postaci tanich taśm czy usług chmurowych, niemniej kłopotów nie brakuje. Jedną z największych bolączek administratorów serwerowni jest rosnąca liczba macierzy dyskowych oraz serwerów. Często pochodzą one od kilku producentów, różnią się wiekiem i bazują na różnych technologiach. Zarządzanie tak skomplikowaną strukturą wymaga użycia odpowiednich narzędzi. Tymczasem, jak wynika z badań Experian Data Quality, jedynie 24 proc. firm korzysta z centralnego systemu zarządzającego danymi.

– Infrastruktura nie musi być droga, pod warunkiem że nie obciąża się jej zbędnymi zasobami. Jestem przekonana, że 80 proc. kosztów eksploatacji pamięci masowej pochłania zarządzanie danymi, czyli takie procesy jak: migracja, obsługa, ochrona i znajdowanie odpowiednich danych – twierdzi Krishna Subramanian, prezes Komprise.

Czy to trafna diagnoza? Hinduska menedżer, która notabene znalazła się na prestiżowej liście „Women of the Channel 2017” amerykańskiego wydania CRN, nie jest  odosobniona w swoim osądzie. W Dolinie Krzemowej działa wiele firm, które podobnie jak Komprise pracują nad rozwiązaniami zapewniającymi uporządkowanie cyfrowych zasobów, a fundusze venture capitals chętnie inwestują w tego typu projekty. Klientów nie powinno zabraknąć, bo na firmowych serwerach spoczywa mnóstwo bezużytecznych plików.

Słaba jakość danych stanowi duży problem w przypadku większości przedsiębiorstw. Korzystanie z tego typu zasobów można porównać do podróżowania dorożką w XXI wieku – mówi Bruce Rogers, CIO w Forbes Media.

 

Jednak przedsiębiorcy powoli zaczynają sobie zdawać sprawę, że należy oddzielić ziarna od plew. Według cytowanego wcześniej badania Experian Data Quality 31 proc. firm planuje w ciągu najbliższych dwunastu miesięcy wdrożyć projekty związane z integracją cyfrowych zasobów.

Dane i koszykówka

Rubrik przygodę z rynkiem IT rozpoczął dwa lata temu od prezentacji rozwiązania do backupu i odzyskiwania danych. Od tego czasu startup zdążył stworzyć osiem jego kolejnych wersji, wprowadzając przy okazji szereg innowacji. Owocem licznych zmian jest platforma Cloud Data Management 4.0, pod względem funkcjonalności budząca nieodparte skojarzenia ze szwajcarskim scyzorykiem. System umożliwia ochronę danych, obsługuje wyszukiwanie indeksowe, a także zarządza backupem, kopiami dokumentów, archiwum oraz zasobami przechowywanymi w chmurze.

Platformę Cloud Data Management 4.0 tworzą oprogramowanie oraz fizyczny sprzęt. W zależności od skali dostępne są wersje o różnych parametrach, ale wszystkie obsługują nośniki SSD i klasyczne dyski. Rubrik zdążył wyrobić sobie markę za oceanem. Resellerzy, którzy wzięli udział w badaniu Pacific Crest Securities, umieścili startup wśród pięciu najbardziej perspektywicznych, młodych dostawców rozwiązań dla centrów danych. W tym gronie znaleźli się także Pure Storage, Nutanix, należące do HPE – Nimble Storage, oraz Simplivity. Rubrik szybko stał się też ulubieńcem inwestorów z Doliny Krzemowej, którzy do tej pory zasilili startup kwotą 292 mln dol. Pod koniec sierpnia do grona inwestorów dołączył koszykarz Kevin Durant, będący graczem Golden State Warriors, aktualnego mistrza NBA.

Firmę obecnie wycenia się na 1,3 mld dol., dzięki czemu dołączyła do tzw. jednorożców, czyli technologicznych startupów o wartości przynajmniej 1 mld dol.

– Jesteśmy dopiero na początku podróży. Realizujemy długoterminową strategię budowy stabilnej firmy. Na razie zrealizowaliśmy mniej niż 10 proc. naszych założeń – przyznaje Bipul Sinha, CEO Rubrik.

 

Trafić na odpowiedni poziom

Większość macierzy dyskowych oferuje funkcję automatycznego rozmieszczania plików w różnych warstwach pamięci. System sprawdza, które dane są najczęściej eksploatowane, i przenosi je na szybkie nośniki SSD, a nieużywane fragmenty trafiają na wolniejszy dysk, np. SATA. Ale co zrobić w sytuacji, gdy firma ma kilka różnych systemów, przechowuje pliki w środowisku lokalnym i chmurze oraz wykorzystuje różne technologie składowania danych? Na rynku pojawiają się rozwiązania, które próbują zmierzyć się z tym wyzwaniem.

 

Nasi klienci przechowujący ogromne ilości danych, korzystający z różnych macierzy dyskowych natrafiają na liczne problemy. Jednym z najważniejszych jest odpowiednia alokacja plików – przyznaje David Cerf, CEO Strong Box Data Solutions.

Wprawdzie firma działa zaledwie od roku, ale ani jej szef, ani pracownicy nie są nowicjuszami w branży pamięci masowych. David Cerf, wcześniej wiceprezes ds. rozwoju biznesu w Crossroads Systems, wykupił system do archiwizacji StrongBox i rozpoczął działalność na własny rachunek. System jest sprzedawany przez Fujifilm pod marką Dternity. Jednak ciekawszym rozwiązaniem wydaje się oprogramowanie StrongLink, które trafiło do sprzedaży na początku roku.

Ten produkt to przyszłość zarządzania danymi – zapowiada szumnie David Cerf.

Omawiane oprogramowanie wyszukuje pliki oraz obiekty i ocenia je na podstawie metadanych, dokonując klasyfikacji. Następnie przenosi dane pomiędzy warstwami lub różnymi urządzeniami. Żeby połączyć różne pamięci masowe w inteligentną pulę, a następnie nią zarządzać, StrongLink wykorzystuje uczenie maszynowe, a także uprzednio zdefiniowane polityki. David Cerf zapewnia, że wdrożenie oprogramowania StrongLink umożliwia obniżenie kosztów związanych z eksploatacją danych nawet o 80 proc.

Alternatywne rozwiązanie oferuje Komprise. Choć ten wspomniany już wcześniej startup działa zaledwie od trzech lat, niemniej zdążył pozyskać 18 mln dol. od inwestorów z Doliny Krzemowej. Firmę dostrzegli też analitycy Gartnera, umieszczając ją na liście „Cool Vendor in Storage Technologies 2017”.

Komprise opracował oprogramowanie łączące funkcje zarządzania pamięciami masowymi z zaawansowaną analityką. Software pozwala administratorowi zdefiniować wiele reguł dotyczących przenoszenia danych oraz ich archiwizacji. Na system składają się dwa elementy: Komprise Director oraz Komprise Observer. Pierwszy z wymienionych służy do zarządzania i administracji. Najczęściej uruchamia się go w chmurze Amazona, jako SaaS lub (rzadziej) jako lokalną maszynę wirtualną. Z kolei komponent Komprise Observer odpowiada za inwentaryzację pamięci masowych oraz realizację polityk zdefiniowanych przez Komprise Director. Jest to wirtualna maszyna umieszczana w środowisku klienta. Użytkownik ma możliwość utworzenia praktycznie nieograniczonej ilości tego typu „wirtualek” wraz ze wzrostem przechowywanych zasobów.

Oprogramowanie zdaje egzamin w dużych przedsiębiorstwach przetwarzających petabajty danych. Nie bez przyczyny na liście referencyjnej klientów Komprise znajdują się m.in. Electronic Arts czy AIG.

– Jak wspomniałam wcześniej, sam proces przechowywania danych jest stosunkowo tani. Nie można tego powiedzieć natomiast o ręcznym zarządzaniu zasobami. Automatyzacja umożliwia odkrywanie danych o znacznej wartości. To atrakcyjna propozycja dla dużych przedsiębiorstw, które coraz częściej przychodzą do nas i proszą o pomoc. Jedno z nich, poważny bank, przez bezużyteczne dane (tzw. zombie) tracił w skali roku 9 mln dol. – podkreśla Krishna Subramanian.