Zaawansowana analiza danych w PySpark

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziamiCzytaj więcej

  • Wydawnictwo: Helion
  • Data premiery: 2023-03-07
  • Okładka: miękka
  • Liczba stron: 192
  • Wymiary: 239 x 166
więcej parametrów

O książce

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Dzięki książce poznasz:

model programowania w ekosystemie Spark

podstawowe metody stosowane w nauce o danych

pełne implementacje analiz dużych publicznych zbiorów danych

konkretne przypadki użycia narzędzi uczenia maszynowego

kod, który łatwo dostosujesz do swoich potrzeb

PySpark: systemowa odpowiedź na problemy inżyniera danych!

Dane szczegółowe

Identyfikator produktu
3339561
Tytuł
Zaawansowana analiza danych w PySpark
Wydawnictwo
Język
polski
Język oryginału
angielski
Liczba stron
192
Typ okładki
miękka
Wydanie
I
Data premiery
2023-03-07
Rok wydania
2023
Wymiary
239 x 166
Waga
0.33 kg
Wysokość
166 mm
Długość
239 mm
Głębokość
10 mm
Liczba elementów zakres
Do 49
Szerokość
165 mm
Nasza cena
52,49 zł
Bądź pierwszy!
Twoja recenzja produktu “Zaawansowana analiza danych w PySpark” będzie bardzo przydatna dla innych użytkowników.
Recenzje produktów są zarządzane przez stronę trzecią w celu weryfikacji autentyczności i zgodności z naszymi wytycznymi dotyczącymi ocen i recenzji
Recenzje
Każdą z recenzji weryfikujemy na trzy sposoby:
  • Klient zweryfikowany
    Autorzy recenzji z tym oznaczeniem są naszymi klientami. Kupili ten produkt w sklepie tantis.pl.
  • Klient niezweryfikowany
    Autorzy recenzji z tym oznaczeniem są naszymi użytkownikami, ale nie możemy potwierdzić, że kupili ten produkt w sklepie tantis.pl.
  • Recenzja Zweryfikowana
    Potwierdzamy, że prezentowana opinia może dotyczyć danego produktu i zawiera elementy jego recenzji.
Dostawa i płatność
Udostępnij produkt
Wstaw link na:
lub skopiuj link
Dodano do koszyka