Zapraszamy na 80 spotkanie Data Community Poland w Bydgoszczy. Maciek - zdalnie z Krakowa, opowie nam o pracy z danymi strumieniowymi w Azure Data Explorer, a następnie Mariusz pokaże jakie antywzorce w SQL mogą znacząco wpływać na jakość i wydajność zapytań.
Czas i miejsce:
24.04.2025, 17:15
Starówka Office
ul. Długa 16
Bydgoszcz
Agenda:
17:00 do 17:15 Wprowadzenie
17:20 do 18:10 Maciej Kępa - (Almost) Complete guide to streaming data with Azure Data Explorer (ONLINE)
18:10 do 18:35 pizza, networking
18:35 do 19:25 Mariusz Wójcik - "Antywzorce SQL"
O wystąpieniach:
(Almost) Complete guide to streaming data with Azure Data Explorer - W dobie błyskawicznie rozwijającej się cyfryzacji kluczowe staje się skrócenie czasu dostępu do danych. Coraz większą popularność zyskuje przetwarzanie strumieniowe, które umożliwia analizę danych w czasie rzeczywistym. Azure Data Explorer (ADX) to szybka, w pełni zarządzana usługa analityczna, pozwalająca na efektywne przetwarzanie i eksplorację dużych wolumenów danych pochodzących z aplikacji, stron internetowych, urządzeń IoT i wielu innych źródeł.
Podczas tej sesji omówimy podstawowe aspekty budowania infrastruktury dla rozwiązań strumieniowych w ADX, w tym:
- Data connections – integrację ze źródłami danych na przykładzie Event Huba
- Ingestion mappings – mapowanie danych w różnych formatach (JSON, CSV, Avro, Parquet)
- Tabele i schematy – projektowanie struktur danych w ADX
- Update policy – mechanizmy transformacji i przetwarzania danych na poziomie bazy
- Security – kontrolę dostępu, zarządzanie tożsamością i zabezpieczanie danych
- Archiving i retencję – strategie przechowywania danych i optymalizację kosztów
- Deployment na dużą skalę – automatyzację wdrożenia ADX na przykładzie Bicepa
Jeśli chcesz dowiedzieć się, jak zbudować skalowalne, wydajne i bezpieczne rozwiązanie do analizy danych strumieniowych, ta sesja dostarczy Ci kompleksowego przewodnika po możliwościach Azure Data Explorer.
Antywzorce SQL
Wydajność zapytań często psuje nie brak sprzętu czy wolny dysk, lecz drobne – lecz powtarzalne – antywzorce w kodzie SQL. To utarte, lecz nieoptymalne konstrukcje: trudne do zauważenia w review, a kosztowne w produkcji. Podczas prezentacji:
- wyjaśnimy, czym antywzorzec różni się od zwykłego błędu i dlaczego rodzi się w dobrze działającym projekcie;
- przejdziemy przez typowy „cykl życia” antywzorca – od niewinnego skrótu w DEV po krytyczną blokadę w produkcyjnej bazie;
- pokażemy metodę szybkiego wykrywania: jak czytać plany wykonania, statystyki I/O i blokady, by w minutę ocenić, czy to właśnie antywzorzec spowalnia zapytanie;
- omówimy proste wzorce naprawcze i kryteria ich doboru, by poprawić kod bez masowej refaktoryzacji;
Prezentację kierujemy do programistów, analityków i DBA, którzy chcą systemowo podejść do problemu wydajności – rozumieć go nie przez pojedyncze triki, lecz przez identyfikację i eliminację całych klas konstrukcji.
O prelegentach:
Maciej Kępa - Inżynier danych oraz lider techniczny w Datumo. Swoją karierę zadedykował obszarom AI/ML, urządzeniom brzegowym oraz IoT. Zawodowo związany z projektowaniem oraz wdrażaniem rozwiązań opartych głównie na chmurze Azure. Zwolennik sztucznej inteligencji zorientowanej na dane (Data-centric AI). Prywatnie miłośnik zwierząt, gier komputerowych oraz majsterkowania.
Mariusz Wójcik
Senior Azure Architect zajmujący się projektowaniem i wdrażaniem skalowalnych, nowoczesnych platform danych opartych na Microsoft Azure. Posiada szerokie doświadczenie w projektowaniu baz danych, przetwarzaniu dużych wolumenów danych oraz implementacji rozwiązań analitycznych.
Aktywnie działa w społeczności IT jako członek zarządu Data Community Poland oraz lider oddziału w Bydgoszczy i Toruniu, angażując się w organizację wydarzeń oraz prowadzi prelekcje na konferencjach branżowych, gdzie dzieli się wiedzą o bazach danych, analityce i rozwiązaniach chmurowych.