Opracowanie Zbiorowe

Zaawansowana analiza danych w PySpark. Metody przetwarzania informacji na szeroką skalę z wykorzystaniem Pythona i systemu Spark

Oprawa miękka
Liczba stron: 192
Wydawnictwo: Helion

41,28 zł

39,26 zł - najniższa cena z 30 dni przed obniżką

69,00 zł - cena detaliczna

Do koszyka

Zamówienie wyślemy 2024-05-10

Potrzeby w zakresie analizy dużych zbiorów danych i wyciągania z nich użytecznych informacji stale rosną. Spośród dostępnych narzędzi przeznaczonych do tych zastosowań szczególnie przydatny jest PySpark - interfejs API systemu Spark dla języka Python. Apache Spark świetnie się nadaje do analizy dużych zbiorów danych, a PySpark skutecznie ułatwia integrację Sparka ze specjalistycznymi narzędziami PyData. By jednak można było w pełni skorzystać z tych możliwości, konieczne jest zrozumienie interakcji między algorytmami, zbiorami danych i wzorcami używanymi w analizie danych.

Oto praktyczny przewodnik po wersji 3.0 systemu Spark, metodach statystycznych i rzeczywistych zbiorach danych. Omówiono w nim zasady rozwiązywania problemów analitycznych za pomocą interfejsu PySpark, z wykorzystaniem dobrych praktyk programowania w systemie Spark. Po lekturze można bezproblemowo zagłębić się we wzorce analityczne oparte na popularnych technikach przetwarzania danych, takich jak klasyfikacja, grupowanie, filtrowanie i wykrywanie anomalii, stosowane w genomice, bezpieczeństwie systemów IT i finansach. Dodatkowym plusem są opisy wykorzystania przetwarzania obrazów i języka naturalnego. Zaletą jest też szereg rzeczywistych przykładów dużych zbiorów danych i ich zaawansowanej analizy.

Polecane tytuły

Materiały o książce

Recenzje

Dodaj własną recenzję.

Dodaj recenzję

Zapraszamy do napisania własnej recenzji, możesz wysłać do nas tekst poprzez formularz.

Komentarze czytelników

Pozostaw komentarz...

Komentarze nie są potwierdzone zakupem

Opis bibliograficzny

Wydawnictwo: Helion

Oprawa miękka
Wydanie: 1
ISBN: 978-83-832-2069-7

Liczba stron: 192
Cena detaliczna: 69,00 zł