Menu Zamknij

Tag: chmura

Kimball, Inmon czy Linstedt – rozmowa o hurtowniach danych [Podcast]

Dzisiejszy temat trochę w innej (zupełnie dla mnie nowej!) formie. Tym razem nie będzie długiego artykułu. Zamiast tego zapraszam Cię do wysłuchania podcastu Marcina Siudzińskiego: Od Danych Do Danych, którego byłem gościem.

Poniżej w artykule znajdziesz więcej informacji jak i dodatkowe materiały. A samego nagrania możesz posłuchać tutaj:

Inmon, Kimball a może Linstedt (Data Vault)?

Rozmawialiśmy o różnych koncepcjach związanych z hurtowniami danych. Oczywiście pojawił się Kimball oraz Inmona. Nie mogło również zabraknąć również Data Vaulta.

Starałem się temat ująć tak, abyś jak najlepiej zrozumiał(a) różnice pomiędzy tymi podejściami. Oczywiście temat jest znacznie głębszy i był to jedynie wierzchołek góry lodowej.

Pojawił się również kontekst dużych danych oraz nowoczesnych hurtowni danych w chmurze.

Certyfikacja z Google Cloud? To żaden problem! [Wideo]

Ostatnimi czasy temat certyfikacji jest bardzo często poruszany. Zwłaszcza chmurowych. A biorąc pod uwagę ostatnie newsy związane z centrum danych Google w Polsce, to certyfikacja GCP jest naprawdę “gorącym” tematem.

Jeżeli się tym interesujesz, to idealnie się składa! 🙂 Mam coś, co może Ci pomóc.

Zapraszam Cię do poznania się z krótką recenzją spotkania grupy GDG Cloud Poznań, na którym miałem okazję dzielić się doświadczeniem i prezentować swoje przemyślenia w kwestii certyfikacji.

Bardzo wartościowym elementem spotkania był panel dyskusyjny z ekspertami z branży. Samo spotkanie składało się z kilku części:

  1. Wprowadzenie
  2. Moja prezentacja dotycząca certyfikatów [6:15]
  3. Przedstawienie ścieżek certyfikacyjnych Google – [22:50]
  4. Panel dyskusyjny [41:00]

ETL vs. ELT – różne podejścia do procesowania danych (OZDB #6)

W poprzednich artykułach z serii Od Zera Do Bohatera omówiłem różnego rodzaju pliki, z którymi możesz się spotkać oraz sposoby przechowywania danych nie tylko ustrukturyzowanych. W ostatnim z kolei opowiedzieliśmy sobie o nowoczesnych podejściach do projektowania systemu opartego o dane.

Do pełnego (wysokopoziomowego) obrazu brakuje nam jeszcze elementu odpowiadającego za przerzucanie danych z jednego miejsca do drugiego. I tu pojawiają się dwa podejścia – ETL vs. ELT.

Te idee nie są szczególnie nowe i już kiedyś o nich pisałem:

ETL vs. ELT, czyli różne podejścia do zasilenia hurtowni i repozytoriów danych

Powyższy tekst ma już kilka lat, ale zerknij do niego jeżeli jesteś ciekaw, jak te dwa podejścia można zastosować w samych relacyjnych bazach danych.

Ten artykuł traktuję jako wersję 2.0. Temat odświeżam tak, aby uwzględnić kontekst chmurowy. Ale zacznijmy pokrótce od podstaw.

Zastanawiasz się, czy warto robić certyfikaty IT? Poznaj różne opinie

Na ostatni wpis w tym roku wybrałem coś lżejszego. Nie będziemy zagłębiać tajników technologicznych, ale odpowiemy sobie na pytanie, które dostałem od Was – czy warto robić certyfikaty.

Czas ku temu jest idealny, bo na początku grudnia z powodzeniem podszedłem do egzaminu na certyfikat: Google Cloud Professional Data Engineer. Można więc powiedzieć, że temat jest mi bliski.

Chciałbym Ci przedstawić, jak to wygląda z mojej perspektywy, czyli:

  • osoby, która sama certyfikaty zdobywa,
  • jest rekruterem technicznym, więc ocenia innych pod kątem wiedzy i doświadczenia,
  • osoby odpowiedzialnej za rozwój organizacji w szeroko pojętych technologiach związanych z przetwarzaniem danych.

Aby zaprezentować jeszcze szerszą perspektywę, to poprosiłem o opinię dwie osoby z firmy GFT, z którą jestem związany. Na tytułowe pytanie pomoże nam odpowiedzieć: Aleksandra Kujawa (Talent Acquisition Manager, czyli szefowa działu odpowiedzialnego za pozyskanie najlepszych ludzi z rynku) oraz Maciej Paszta (Executive Delivery Manager, osoba odpowiedzialna za kluczowych klientów w firmie).

Jak przechowywać dane (nie tylko) relacyjne? Na przykładzie Google Cloud Platform (OZDB #4)

Dane ustrukturyzowane czy nie? Relacyjne czy nie? Duże lub małe? Silna spójność w danych (ang. strong consistency) czy ostateczna (ang. eventual consistency)?

Sporo tego, prawda? W tym artykule rozwieję trochę wątpliwości. Myślę, że jak to omówimy, to w połączeniu z rozumieniem typów plików (przybliżonych w poprzednim wpisie), będzie Ci łatwiej poruszać się w świecie przetwarzania danych.

Temat różnych typów danych poruszyłem już we wpisie omawiających 7 pytań, które musisz zadać, projektując system przetwarzający dane. Jeżeli go nie znasz, to mocno zachęcam, aby spojrzeć na niego w pierwszej kolejności. Dzisiejszy artykuł jest jego rozwinięciem.

Z racji, że aktualnie najbardziej na czasie są technologie chmurowe, a mi z kolei najbliżej do Google Cloud Platform, to na tym rozwiązaniu się głównie skupimy, od strony narzędziowo-praktycznej. Większość z wymienionych tu usług odwiedzimy jeszcze osobno, aby dokładniej się im przyjrzeć, ale teraz chciałbym Ci te rozwiązania przedstawić z “lotu ptaka”. Umożliwi Ci to poznanie możliwości, które mamy w naszej palecie.

7 największych dostawców technologii chmurowych na świecie

We wcześniejszych wpisach oraz dokumencie wprowadzającym do chmury kilkukrotnie pojawiały się nazwy takich produktów jak Amazon Web Services (AWS), Google Cloud Platform (GCP) oraz Microsoft Azure.

Zdecydowanie te firmy można uznać za czołowych graczy. Ale czy tylko? Chciałbym pokazać Ci, że świat chmur jest trochę większy i zaprezentować wybraną przez siebie listę TOP 7 firm, które pojawiają się na tym rynku.

Wszystkie rozwiązania (poza jednym, ale o tym dalej) są bardzo zbliżone do siebie jeżeli chodzi o podstawowe komponenty. Na każdej chmurze utworzymy np. maszynę wirtualną, bazę danych, skorzystamy z konteneryzacji i całość połączymy siecią wirtualną.

Jednak pomiędzy trzema wymienionymi powyżej a całą resztą dość łatwo znaleźć różnice, które sprawiają, że akurat te, a nie inne wiodą prym. Sprawa się komplikuje jeżeli chcemy porównać trzech głównych graczy. Często jest tak, że porównanie ich pod względem konkretnych funkcji, wydajności i możliwości kończy się tzw. flame war, a wtedy nikt już nie bierze jeńców 🙂

22 zagadnienia, które pomogą Ci zrozumieć technologie chmurowe

Korzystasz z Google Drive, Dropbox, a może OneDrive? Super! To technicznie rzecz ujmując, korzystasz z bardzo modnej technologii, czyli chmury obliczeniowej (ang. Cloud Computing). A może korzystasz z więcej niż jednego rozwiązania? Jeżeli tak, to już jesteś na bieżąco z trendami w branży, ponieważ model Multicloud, gdzie korzystamy z więcej niż jednej chmury, zyskuje na popularności. Oczywiście w praktyce jest to trochę bardziej skomplikowane. Ale tylko trochę 🙂

O co chodzi z tą całą chmurą?

Kojarzysz pomysł samochodów, rowerów lub hulajnóg na minuty? Jeżeli tak to właśnie wyjaśniliśmy sobie główną ideę chmury 🙂 Dla osób, które nie miały okazji z takich usług korzystać, to krótkie wyjaśnienie. W większych miastach firmy udostępniają samochody, rowery, hulajnogi, które można wynająć za pomocą smartfona. Płacimy jedynie za wykorzystany czas i/lub kilometry (dodatkowo czasem pojawia się opłata początkowa).

Podobnie jest z chmurą publiczną, tylko zamiast pojazdów masz elementy systemu IT, takie jak infrastruktura, oprogramowanie, a nawet usługi. Idea polega na tym, abyś Ty, Twoja firma, Twój klient, nie musieli w to inwestować. Zamiast tego wszystko jest dostępne w jednym miejscu, a Ty płacisz jedynie za to co zużyłeś. Brzmi ciekawie, prawda?