Plus d’un million de livres à portée de main !
Bookbot

Jurney Russell

    Zwinna analiza danych Apache Hadoop dla każdego
    Agile Data Science 2.0
    • Agile Data Science 2.0

      Building Full-stack Data Analytics Applications with Spark

      • 352pages
      • 13 heures de lecture

      "Data science teams looking to turn research into useful analytics applications require not only the right tools, but also the right approach if they?re to succeed. With the revised second edition of this hands-on guide, up-and-coming data scientists will learn how to use the Agile Data Science development methodology to build data applications with Python, Apache Spark, Kafka, and other tools. Author Russell Jurney demonstrates how to compose a data platform for building, deploying, and refining analytics applications with Apache Kafka, MongoDB, ElasticSearch, d3.js, scikit-learn, and Apache Airflow. You?ll learn an iterative approach that lets you quickly change the kind of analysis you?re doing, depending on what the data is telling you. Publish data science work as a web application, and affect meaningful change in your organization"--Back cover

      Agile Data Science 2.0
    • Duże zbiory danych dla każdego! W dobie Big Data klasyczne podejście do analizy danych nie przynosi już pożądanych wyników. Skuteczna analiza gigantycznych zbiorów informacji, wyciąganie interesujących wniosków i prezentowanie ich w przejrzystej formie użytkownikowi wymagają mnóstwa czasu i środków. Zastanawiasz się, jak podejść do tego problemu, by zminimalizować ryzyko niepowodzenia? Na to i wiele innych pytań odpowiada ta fantastyczna książka. Dzięki niej dowiesz się, jak zaprząc platformę Hadoop do własnych celów. Skorzystasz z prostych narzędzi, takich jak język Python, biblioteka D3.js oraz Apache Pig, i zastosujesz zwinne podejście do problemu, by osiągnąć zaskakujące efekty. Ponadto przekonasz się, jak łatwo można publikować dane w MongoDB, stosować wyszukiwarkę ElasticSearch oraz wykorzystać potencjał chmur obliczeniowych. Nauczysz się także wizualizować dane na wykresach, prognozować oraz podejmować właściwe działania. Książka ta jest doskonałą lekturą dla wszystkich osób stojących przed problemem skutecznej pracy z ogromnymi zbiorami danych. Dzięki tej książce: poznasz najlepsze narzędzia do przetwarzania zbiorów danych wykorzystasz możliwości języka Python sprawdzisz możliwości chmur obliczeniowych błyskawicznie wyszukasz dane za pomocą ElasticSearch zwizualizujesz dane z użyciem D3.js Zwinnie rozwiąż problemy z dużymi zbiorami danych!

      Zwinna analiza danych Apache Hadoop dla każdego