Mam dla Ciebie niesamowitą historię człowieka, który zmienił swoje życie o 180 stopni zaczynając swoją przygodę w IT.
Michał Misiuda zagadał do mnie w sierpniu 2021 roku. I tak przez jakiś czas wymienialiśmy wiadomości, co w efekcie poskutkowało dołączeniem Michała do GFT w lutym 2022 roku, gdy był już w Polsce.
Poprosiłem go czy mógłby się podzielić swoją niezwykłą historią. Uważam, że może być inspiracją dla niejednej osoby rozważającej wejście w świat IT. Zwłaszcza dla tych, którzy borykają się z różnymi wątpliwościami. Oddaję głos Michałowi. Przyjemnego czytania! 🙂
Jak w wieku 40 lat przejść od blendera do komputera?
Nie każdy od dziecka wie, czym chciałby się w życiu zajmować. Niektórzy ludzie odnajdują swoje powołanie w latach wczesnej młodości, a inni długo nie do końca wiedzą, na co się zdecydować. Jeszcze inni decydują się na zmianę ścieżki kariery po latach. Nie raz jest to lekka zmiana np. specjalizacji, a niekiedy całkowita zmiana dziedziny. Tak było i w moim przypadku.
Kim jestem?
Cześć! Mam na imię Michał i w tym wpisie przedstawię pokrótce, jak po 15 latach pracy jako profesjonalny kucharz przeszedłem do świata IT.
Praca na kuchni nie była moim pierwszym wyborem. W liceum nie interesowałem się ani samą gastronomią, ani niczym z nią związanym. Wybrałem klasę o profilu matematyczno-informatycznym, ponieważ jak niejednego mojego rówieśnika, „ciągnęło mnie do komputerów”.
Patrząc jednak na to z perspektywy czasu, nie wiem, czy można było naszą klasę nazwać profilowaną. Z lekcji informatyki utkwiły mi w pamięci tylko „zaawansowana” prezentacja w PowerPoincie oraz napisanie pliku .bat, który już nawet nie pamiętam, co robił.
Po zdaniu matury górę nad ambicjami wzięło lenistwo i zamiast na politechnikę trafiłem na studium gastronomiczne. Dlaczego tak? Nie będę kłamał, nie chciało mi się uczyć. Do tego obowiązywała prawie roczna służba wojskowa, której chciałem uniknąć. Wojsko w tamtych czasach nie cieszyło się dobrą sławą. Nauka gastronomii wydała mi się więc łatwym wyjściem, a na dodatek kiedy już się tam zapisałem, trochę nawet zaczęła mnie interesować.
Po ukończeniu szkoły trafiłem za granicę. Nie będę tutaj zanudzał szczegółami, ale streszczając w kilku słowach — pracowałem w różnych hotelach, poznałem wspaniałych ludzi, w tym moją żonę oraz przeżyłem niezapomniane chwile. Przyszedł jednak moment, w którym praca przestała mi dawać satysfakcję. Nie wiem tak naprawdę, czym było to spowodowane. Zbiegło się to jednak w czasie z narodzinami naszego syna. Po długich rozmowach postanowiliśmy z żoną wrócić do Polski, żeby Mały mógł się wychowywać bliżej rodziny. Ta decyzja pociągnęła za sobą szereg różnych wydarzeń, w tym moją decyzję o zmianie zawodu.
A dlaczego IT?
Jak wcześniej wspomniałem, w młodości ciągnęło mnie do komputerów i tak na dobrą sprawę nigdy nie przestało. Osobą, która pchnęła mnie w tym kierunku był mój brat, który jest programistą z wykształcenia i od wielu lat pracuje w tym zawodzie. Któregoś razu rozmawiając z nim wspomniał, że w branży IT jest duże zapotrzebowanie na programistów, i przez to łatwiej się dostać niż kiedyś. Naturalnie wzbudziło to moje zainteresowanie, ale jedna myśl w mig ostudziła mój zapał. W mojej głowie widziałem programowanie jako wyższą matematykę, której trzeba się uczyć co najmniej 5 lat na studiach. Od razu pomyślałem, że nie dam sobie z tym rady. Brat jednak wytłumaczył mi, że to wcale tak nie wygląda, i że są gałęzie programowania, w których używa się mało matematyki lub wręcz w ogóle. Patrząc wstecz, sam śmieję się z tej matematycznej wizji świata IT.
Jak zacząłem?
Wybranym przeze mnie językiem programowania był Python. Od razu mi się spodobał, pewnie przez swoja przystępność i łatwość w nauce (na początku).
No dobra, mam podstawy, co dalej? Jeżeli jesteś na etapie wyboru języka, to pomyśl, co chcesz robić i później wybierz odpowiedni do tego język. Nie na odwrót. Nie trać czasu na naukę czegoś, co później może okazać się nieprzydatne. Ja miałem w tym temacie trochę szczęścia. Już wyjaśniam.
Nie mając jasno sprecyzowanego celu, uczyłem się zaleconych przez brata podstaw, czyli najpopularniejszych algorytmów oraz struktur danych. Któregoś dnia przeglądając internety, natknąłem się na temat analizy danych. Dowiedziałem się, że Python jest szeroko wykorzystywanym językiem przy pracy z danymi. Im bardziej poznawałem zagadnienia związane z tą dziedziną, tym bardziej mi się ona podobała. Tu właśnie miałem to szczęście przy doborze języka. Moją uwagę zawsze przykuwały różnego rodzaju wykresy oraz infografiki przedstawiające różne statystyki, ale nigdy nie pomyślałem, że ja też mógłbym to robić. Zdecydowałem się pójść w tym kierunku.
Tak się złożyło, że w tym okresie dużo było szumu wokół Data Science. Dla mnie, kogoś kto dopiero niedawno zobaczył swoje pierwsze „Hello World”, myśl o napisaniu czegoś z wykorzystaniem uczenia maszynowego była czymś ekscytującym. Zacząłem więc zagłębiać się w ten temat, robiąc różne kursy i czytając artykuły. Po jakimś czasie napisałem w końcu kilka krótkich analiz, w których zawarłem algorytmy regresji liniowej oraz algorytmy klasyfikujące. Zahaczyłem też o temat sieci neuronowych. Ktoś mógłby zapytać:
„Zaraz, zaraz, jak to? Przecież mówiłeś, że z matmą Ci nie po drodze”…
I miałby rację. Wtedy nastąpił mały punkt zwrotny. Doszedłem do wniosku, że nie sztuką jest wrzucenie danych w algorytm i otrzymanie predykcji. W moim przekonaniu ktoś, kto chciałby zajmować się Data Science zawodowo, powinien wiedzieć, za co odpowiedzialne są poszczególne parametry danego algorytmu oraz być w stanie dostosować je do potrzeb swojego problemu. A już na pewno wypadałoby rozumieć matematykę, która za tym wszystkim stoi. Ja nie do końca ją rozumiałem. Nie chciałem robić czegoś na siłę i postanowiłem, że skupię się na temacie samej analizy danych.
Każdy uczy się na swój sposób
U mnie niestety wyglądało to trochę chaotycznie. Najpierw uczyłem się „ogólnego” programowania w Pythonie. Później Pythona pod kątem analizy danych (Pandas, NumPy i biblioteki do wizualizacji danych jak Seaborn i Plotly). Następnie poszedłem w kierunku Data Science, gdzie nadrabiałem zaległą matematykę i statystykę oraz poznawałem różne aspekty algorytmów uczenia maszynowego, by na końcu powrócić do analizy danych i zająć się nią trochę dokładniej. Dołożyłem wtedy do swojego tech stacku SQL (którego, wstyd przyznać, zlekceważyłem na początku) oraz Tableau jako narzędzie do tworzenia dashboardów.
Z czego się uczyłem?
Z materiałów dostępnych w sieci. Największą ich część stanowiły kursy on-line na platformach jak Udemy czy Coursera. Oprócz tego dużo dowiadywałem się czytając artykuły, prace i nawet dyskusje na forach. Jeśli chodzi o projekty do portfolio, w internecie jest tyle materiałów na ten temat, że na pewno każdy z łatwością znajdzie coś dla siebie. Zadbaj, aby Twój projekt pokazywał jak najwięcej umiejętności (przykład: nie używam gotowego data setu z Kaggle tylko pokazuję, że umiem sam zebrać dane z jakiegoś API lub poprzez web scraping).
Z pewnością cały proces trwałby krócej, gdybym od początku ułożył sobie dobrze sprecyzowany plan i krok po kroku go wykonywał. To też rekomenduję osobom, które rozpoczynają proces nauki.
Ale właśnie — ile to wszystko trwało?
Zaczynając naukę, być może natkniecie się na hasła typu „zostań programistą w trzy miesiące” albo „Twoja pierwsza praca w IT już po miesiącu”… Mi zajęło to trzy lata. Dlaczego tak długo? Przede wszystkim przez brak konsekwencji i systematyczności w nauce. Nie żebym się tłumaczył, ale do tego miałem stałą pracę na etacie, z której codziennie wracałem po 23:00 (uczyłem się przeważnie rano, przed pracą) oraz noworodka w domu (z czego akurat byłem dumny :)).
Pandemia COVID-19 pomogła mi w znacznym stopniu. Branża hotelarska stanęła. Zostaliśmy zamknięci w domu, miałem więcej czasu na naukę.
Pojawiły się również inne wyzwania
Cały proces przebranżawiania się wiąże się również z mniej technicznymi wyzwaniami. I tu na początku ogarnęły mnie wątpliwości. Czy dam sobie radę? Czy w ogóle się do tego nadaję? Na te pytania szybko jednak sobie odpowiedziałem. Dam radę. Prędzej czy później, ale dam. Nawet jakby to miało trwać i pięć lat, w końcu to zrobię. Dodatkowym czynnikiem motywującym były trudne sytuacje w pracy, w których człowiek ma po prostu ochotę wszystkim rzucić i wyjść. Jeśli pojawią się u Ciebie takie wątpliwości, przypomnij sobie, dlaczego podjąłeś tę decyzję i dlaczego chcesz tej zmiany.
Następne obawy, które mnie naszły związane były z tym, jak osoby z wykształceniem wyższym kierunkowym postrzegają samouków. Ludzie są różni. Niektórzy czują pewną niechęć do osób, które same się uczą. W końcu Ci pierwsi musieli przechodzić przez lata nauki, zdając sesje egzaminacyjne oraz broniąc swoich prac magisterskich (czy też doktoranckich). Samouk z kolei (w ich odczuciu) porobi kilka kursów on-line, poczyta trochę artykułów i już puka do drzwi pracodawców.
Na szczęście takich osób jest niewiele i najprawdopodobniej ich nie spotkacie. Znaczna większość ludzi, jest bardzo życzliwa i chętnie służy pomocą. Jest jedna rzecz, która bardzo mi pomogła — rozmawianie z ludźmi. Najzwyczajniej w świecie pisałem na LinkedIn do obcych osób, które pracowały w branży. Mówiłem im, że jestem w trakcie zmiany zawodu i pytałem, czy mogłyby mi opowiedzieć o realiach zawodu analityka. Większość nie odpisywała, ale od tych, którzy odpisali otrzymałem wiele wskazówek oraz interesujących informacji. Pozwoliły mi one skupić się na odpowiednich aspektach nauki.
A co z pierwszą pracą?
Jeśli chodzi o temat szukania pierwszej pracy, od razu mogę powiedzieć, że zacząłem to robić za późno. Powinienem zacząć wysyłać CV kilka miesięcy wcześniej. Proces rekrutacyjny sam w sobie przeważnie trwa kilka tygodni, ale żeby wziąć w nim udział, ktoś się musi do Was najpierw odezwać z ofertą pracy. Bez wykształcenia ani doświadczenia byłem, co tu dużo mówić, nieatrakcyjnym kandydatem. Mijały miesiące, a ja zbierałem w swojej skrzynce listy odmowne. Jeżdżąc do pracy słuchałem różnych podcastów na temat pracy w analizie danych. W jednym z nich prowadzący mówił o pewnej dziewczynie, która dostała pracę jako analityk znając tylko Tableau, bez znajomości SQL czy Pythona. Pomyślałem: Co? Jak to? Tyle to i ja chyba umiem.
Często widziałem na Reddit podobne wpisy o ludziach zaczynających pracę, ale nie do końca mających umiejętności techniczne. Nie powiem, było to trochę demotywujące. Jeśli będziesz miał chwile zwątpienia, nie poddawaj się! W końcu i Ty dostaniesz szansę.
Ja swoją dostałem kilka miesięcy później.
Czytając oferty pracy na pozycję analityka prawie wszędzie była wzmianka o analizie biznesowej, a mnie osobiście takowa nie interesowała. Często wymagane były studia z ekonomii bądź innej dziedziny związanej z finansami, a do zakresu obowiązków należało m.in. prezentowanie analiz „na pierwszej linii”, czyli przed przełożonymi. Ja chciałem po prostu pracować z danymi. Gdzieś tam w swoim kącie przetwarzać, transformować, wizualizować, szukać odpowiedzi na ciekawe pytania.
Kilka tygodni przed pierwszą rozmową kwalifikacyjną czytając artykuł związany z Big Data, spotkałem się z tematem inżynierii danych. Nigdy wcześniej nie zwróciłem uwagi na aspekt pozyskiwania i przechowywania danych, tworzenia i zarządzania bazami danych, czy też dostarczania danych do działów analitycznych. Wydało mi się to bardzo interesujące. Po krótkiej lekturze na ten temat zdałem sobie sprawę, że inżynier danych nie zajmuje się sposobami maksymalizowania przychodów. Nie skupia się też na robieniu prezentacji dla przełożonych. Jest raczej taką trochę niewidzialną osobą działającą za kurtyną. Jeśli Tobie, podobnie jak mi, taka rola odpowiada, być może jest to kierunek, nad którym warto się zastanowić.
„Stanie za kurtyną” to dość niesprecyzowany termin, zainteresowanych odsyłam do popularnej wyszukiwarki internetowej w celu poznania natury zadań, jakie stoją przed inżynierem danych 🙂
A jak było z tą pierwszą pracą? Wspomniałem wcześniej o rozmawianiu z ludźmi na LinkedIn. Jedna z osób, które mi odpowiedziały była na tyle życzliwa, że ułatwiła mi dostanie się na program treningowy w jednej z firm IT. Jestem jej za to niezmiernie wdzięczny. Akurat w tym samym czasie dostałem kilka pozytywnych odpowiedzi i nawet odbyłem już kilka rozmów z różnymi firmami. Pozycje, na które aplikowałem, wiązały się z pracą analityka. A ja właśnie zacząłem się interesować inżynierią danych, z którą związany był wcześniej wspomniany program treningowy. Postanowiłem wziąć w nim udział, bo dawał on szansę na późniejszą pracę w firmie.
Podsumowując – źle do tego wszystkiego podszedłem 🙂
Jeśli miałbym podsumować w kilku zdaniach moją ścieżkę od blendera do komputera, to powiedziałbym, że źle do tego podszedłem. Niemniej jednak pomimo zaawansowanej prokrastynacji i chwil zwątpienia, dążyłem mniej lub bardziej skutecznie do celu. Gdybym zaczynał ten proces dzisiaj, zrobiłbym to trochę inaczej. Na pewno ułożyłbym konkretniejszy plan nauki i systematyczniej go realizował. Miałbym także bardziej sprecyzowany cel, dzięki któremu uniknąłbym uczenia się mniej przydatnych rzeczy. Nie ma jednak co się zastanawiać ani gdybać. Pisząc ten wpis przygotowuję się właśnie do certyfikatu ze Spark’a, który mam nadzieję będzie moim pierwszym krokiem w stronę profesjonalnej kariery w inżynierii danych.
Pozdrawiam i życzę powodzenia oraz wytrwałości w realizowaniu Twoich celów 🙂
Słowo od autora
Mam nadzieję, że tekst był interesujący, a może nawet inspirujący 🙂 W chwili gdy publikuję ten materiał, Michał ma już za sobą zdany egzamin ze Sparka!
Inspirujący artykuł 🙂 Czy może ciąg dalszy, albo kontakt do bohatera artykułu, jak by to zaplanował. Nie ukrywam, że sam chcę coś podobnego zrobić i każda wskazówka jest cenna 🙂
Cześć Sebastianie!
Dziękuję za komentarz.
Z przyjemnością dam znać Michałowi 🙂 A może spróbujesz go złapać na LinkedIn?
Pozdrawiam!
Gratuluję uporu i zajawki. Ja jestem w 1/4 tej drogi i nie wiem czy mi wystarczy sił i wiary. Na razie nauczyłem się trochę Pythona i SQL. Mam gorzej bo moja obecna praca jest fajna i choć nie związana z IT, to Pythona i SQL zdarza mi się używać.
Cześć Marcinie!
Dziękuję za komentarz i powodzenia 🙂 Jeżeli potrzebujesz jakichś wskazówek, to pisz śmiało 🙂
Pozdrawiam!
Pracuję w firmie handlowej (soft: Subiekt, sprzedaż hurtowa – nie ma tyle rekordów co przy detalu). Do tej pory udało mi się wspomóc proces zamawiania towaru (dzięki możliwości pisania własnych zapytań/zestawień SQL) oraz proces informowania klientów o przychodzących dostawach na podstawie nieefektywnych zapytań (też własne zestawienie SQL). Python oprócz zabawy to próby w pracy z Pandas i Jupyter Notebook. Marzy mi się konkretne analizowanie zakupów/sprzedaży. Jednak wydaje mi się że Excel jest wystarczający i równie dobry do takiej analizy i że w Excelu jest “łatwiej”. Brakuje mi też wiedzy merytorycznej jak powinna wyglądać i co powinna zawierać analiza zakupów i sprzedaży, aby wyciągnąć konstruktywne wnioski.
Może moglibyście zrobić listę zagadnień-kluczy przez które trzeba się przekopać, żeby sprawnie analizować takie dane?
U mnie uczenie się nowych rzeczy jest przeplatane z momentami stagnacji, gdy nie mam nowych pomysłów jak usprawnić pracę.
Dzięki za pomoc 🙂
Cześć!
Dzięki za Twój komentarz.
Nie wiem czy będę w stanie Ci pomóc, bo jak pewnie zauważyłeś w moim wpisie analiza biznesowa to nie była moja mocna strona.
Nie posiadam profesjonalnej wiedzy z tematyki biznesowej, jestem pewien, że wiesz więcej na ten temat niż ja, ale wydaje mi się, że aspekty, na których móżna się skupić w analizie to np.:
– Dynamika sprzedaży, czyli to jak szła nam sprzedaż na przestrzeni ostatnich <tu wrzuć podziałkę typu lat, miesięcy, tygodni :)> z porównaniem analogicznych okresów z przeszłości, co pozwoli wykryć anomalię oraz stwierdzić czy się rozwijamy czy coś idzie nie tak. To tego dochodzi też wyłapywanie trendów oraz próby przewidywania sprzedaży czy też próba wyznaczania celu sprzedażowego.
– Segmentacja klientów. Nie wiem czy macie duże zróżnicowanie, ale nawet jeśli nie to zawsze można klientów jakoś podzielić (na podstawie tego co kupują, jak często i ile wydają) po czym zpersonalizować bardziej kierowaną do nich ofertę.
– Stan magazynu. Wydaje się trywialne, ale nie raz czytałem jak zalegający miesiącami, niesprzedany towar uniemożliwiał składowanie bardziej chodliwych produktów. Od razu dorzućmy w tym miejscu analizę sprzedawalności poszczególnych produktów, jeśli to ma znaczenie z podziałem geograficznym czy też sezonowym.
Można też analizować wyniki sprzedaży poszczególnych pracowników oraz skuteczność w pozyskiwaniu
nowych klientów (oczywiście jeśli takie sytuacje występują) co może pomóc np. w konstruowaniu systemów motywacyjnych.
Excel jak najbardziej się do tego sprawdzi, ale nic nie stoi na przeszkodzie, żebyś taką analizę przeprowadził sobie w Pandas i później zamiast wykresów w arkuszu kalkulacyjnym zrobił dashboard np. w PowerBI, który będzie pokazywał wybrane przez Ciebie dane. Jako dodatek możesz napisać skrypt w Pythonie, który po uruchomieniu będzie to wszystko robił automatycznie biorąc za input nowy plik z danymi uaktualniając tym samym wspomniany dashboard w PowerBI (lub tworząc nowy).
Podejrzewam, że nie napisałem w moim komentarzu nic czego byś już nie wiedział, bo są to dość podstawowe informacje, ale tak jak wspomniałem na początku nie mam zbytniej wiedzy biznesowej.
Nie wiem jak to co napisałem aplikuje się do Twojej branży, ale mam nadzieję, że choć trochę udało mi się pomóc.
Pozdrawiam!
Cześć Michał,
dziękuję za Twoją odpowiedź.
Kurczę, chyba tak naprawdę bardziej chodzi mi o inżynierię danych niż analizę biznesową.
Trochę się miotam w tym wszystkim ;).
Anyway… Wydrukowałem sobie Twój wpis, będzie dla mnie cenną wskazówką.
Pozdrowienia!
Cześć!
W tym przypadku inżynieria danych sprowadzałaby się do zautomatyzowania całego procesu.
Przykładowo tworzysz pustą, SQLową bazę danych, piszesz pythonowy skrypt, który będzie populował tą bazę danych informacjami z Twojego pliku zakupów/sprzedaży tworząc tabele z “surowymi” danymi (tu zapoznasz się z tematem łączenia SQL z Pythonem jeśli nie miałeś z tym styczności, a jeśli masz już gotową bazę danych na starcie możesz po prostu wczytać te dane w swoim skrypcie), następnie przeprowadzasz potrzebne Ci transformacje/agregacje, grupowanie itd. w Pandas tworząc DataFrame’y, zachowujesz je w podobny sposób jak wcześniej w osobnych tabelach (już “przetransformowanych”) i na końcu wysyłasz “czyste” informacje do narzędzia typu PowerBi, żeby zrobić dashboard.
Zapoznaj się z tematyką orkiestracji takich data pipeline’ów przy pomocy takich narzędzi jak Airflow, czy nawet prostszym Cron job’em, do tego poczytaj o koncepcie “bronze-silver-gold data architecture”, który możesz zastosować w swoich SQLowych bazach danych.
To tylko wierzchołek góry lodowej możliwości jakie są obecnie dostępne, na pewno znajdziesz pasujące Ci rozwiązanie kiedy trochę zagłębisz się w temat.
Powodzenia i miłego majsterkowania!
Cześć!
o kurczę, to właśnie o to chodziło! Trafiłeś w sedno. Mało z powyższego wpisu rozumiem, czyli dużo inspiracji do nauki…
Jestem Ci bardzo wdzięczny 🙂
Dziękuję
Cieszę się, że Ci się to przydało.
Na początek może nie zawracaj sobie głowy Airflowem i automatyzacją całego procesu, bardziej skup się na architekturze swojego projektu zapoznając się z podstawami i dobrymi praktykami budowy takiej bazy danych (wspomniane wcześniej “bronze-silver-gold data architecture” czy też “medallion data architecture”, poprawne klucze itd.) oraz sprawnego poruszania się między Pythonem a SQL.
Dopełniając wiedzę z zakresu baz danych możesz zapoznać się z tematem NoSQL i różnic między NoSQL a SQL, może Ci się to przydać.
Na koniec coś o czym zapomniałem wspomnieć we wcześniejszym wpisie. Cały proces pozyskania, transformacji i wysłania danych do analizy to proces, który nazywa się ETL (Extract-Transform-Load). Poczytaj trochę czym jest ETL oraz o jego wariantach (ELT oraz reverse-ETL) bo ta wiedza będzie Ci bardzo pomocna w sprawnym tworzeniu przyszłych projektów.
Powodzenia! 🙂
Super dyskusja! 🙂 Marcinie, dodam od siebie, że część informacji znajdziesz na tym blogu, np.:
Jeżeli interesuje Cię bardziej analityczny SQL to zajrzyj tu: SQL Analityczny.
Powodzenia! 🙂
Dziękuję.
Teraz mam bufor zadań wypełniony prawie na maxa :).
Działam i jakby coś to będę się odzywał!
Cześć Michał,
minęło trochę czasu. Ciutkę poszedłem do przodu.
Zapoznałem się trochę lepiej z pandas i zrobiłem trochę różnych wykresów.
Próbka tu:
https://github.com/preslaw/Item_sales_analysis_Pyplot/blob/main/Item_stock_over_months.ipynb
Sposób pobierania danych z systemu (Subiekt) mam bardzo kiepski. Mianowicie zapisuję różne dane z zestawień Subiektowych do xls’a i z to jest moje źródło danych.
Nie za bardzo widzę potrzebę tworzenia bazy SQL po drodze.
Najlepiej było by podpiąć się bezpośrednio do bazy danych Subiekta i stamtąd brać informacje. Ale po pierwsze nie wiem jak to zrobić, a po drugie musiałbym w SQL od nowa napisać zapytania, które w Subiekcie są już napisane.
Jak widzisz moje tempo nie jest oszałamiające :):):).
Pozdrawiam
Cześć!
Tempo niby jest ważne, ale nie najważniejsze, byleby do przodu 🙂
Zauważyłem, że użyłeś funkcji median() zamiast mean() do wyliczenia “mean_price”, celowo?
Co do pozbywania się NaN’ów możesz pokombinować z funkcją fillna(), może uda Ci się skrócić kod 🙂
Jeśli interesuje Cię cześć z wizualizacjami możesz też modyfikować swoje wykresy w różny sposób (ja zrobiłem coś takiego, zerknij na pkt 3. w tym notebooku: Hotel’s customers EDA and clustering. | Kaggle )
Co do Subiekta niestety nie wiem czy ma jakieś dostępne API bo program nie jest mi znany, ale jeśli masz te dane w Excelu ogarnięte w miare sprawnie to nie ma tragedii 🙂
Najważniejsze żebyś się nie zniechęcał jakimiś niepowodzeniami czy właśnie wolniejszym tempem, a jak coś to zawsze możesz napisać do nas np. tutaj 🙂
Pozdrawiam i powodzenia!
Cześć,
dzięki za odpowiedź.
Median vs mean – elegancko to wyłapałeś :). Na początku miała być średnia. Ale że oprócz sprzedaży hurtowych, trafiają się też detaliczne (z dużo wyższymi cenami sprzedaży), które zaburzają średnią cenę sprzedaży, to zdecydowałem przerzucić się na medianę, z tym że nazwy zmiennej już nie zmieniłem. Oczywiście powinienem to zmienić bo wprowadza to w błąd.
Zapoznam się z Kaggle – dzięki za inspirację.
Walczę dalej :):).
Pozdr
Walcz walcz 🙂
Co do Kaggle to świetna strona. Dużo datasetów i kodu, z którego można się sporo nauczyć. Ciebie pewnie bardziej będą interesowały notebooki z gatunku “EDA” (Exploratory Data Analysis) niż te z uczeniem maszynowym, predykcjami i sieciami neuronowymi (jak wspomniałem w tym wpisie mnie akurat to przerosło z racji nieznajomości matematyki, która się odbywała za kulisami :P), ale zerknij też i na nie, może akurat będzie to coś dla Ciebie.
Powodzenia! 🙂
Bardzo dobry artykuł!