By Nathan Marz

  • Einführung in Big-Data-Systeme und -Technologien
  • Große Datenmengen speichern und verarbeiten
  • Einsatz zahlreicher instruments wie Hadoop, Apache Cassandra, Apache hurricane uvm.

Daten müssen mittlerweile von den meisten Unternehmen in irgendeiner shape verarbeitet werden. Dabei können sehr schnell so große Datenmengen entstehen, dass herkömmliche Datenbanksysteme nicht mehr ausreichen. Big-Data-Systeme erfordern Architekturen, die in der Lage sind, Datenmengen nahezu beliebigen Umfangs zu speichern und zu verarbeiten. Dies bringt grundlegende Anforderungen mit sich, mit denen viele Entwickler noch nicht vertraut sind.

Die Autoren erläutern die Einrichtung solcher Datenhaltungssysteme anhand eines speziell für große Datenmengen ausgelegten Frameworks: der Lambda-Architektur. Hierbei handelt es sich um einen skalierbaren, leicht verständlichen Ansatz, der auch von kleinen groups implementiert und langfristig betrieben werden kann.

Die Grundlagen von Big-Data-Systemen werden anhand eines realistischen Beispiels praktisch umgesetzt. In diesem Kontext lernen Sie neben einem allgemeinen Framework zur Verarbeitung großer Datenmengen auch Technologien wie Hadoop, hurricane und NoSQL-Datenbanken kennen.

Dieses Buch setzt keinerlei Vorkenntnisse über instruments zur Datenanalyse oder NoSQL voraus, grundlegende Erfahrungen im Umgang mit herkömmlichen Datenbanken sind aber durchaus hilfreich.

Aus dem Inhalt:

  • Big-Data-Systeme und -Technologien
  • Echtzeitverarbeitung sehr großer Datenmengen
  • Lambda-Architektur
  • Batch-Layer: Datenmodell, Datenspeicherung, Skalierbarkeit
  • Stapelverarbeitungsprozesse
  • Modellierung von Stammdatensätzen
  • Implementierung eines Graphenschemas mit Apache Thrift
  • Einsatz von MapReduce
  • JCascalog zur Implementierung von Pipe-Diagrammen
  • Serving-Layer: Konzepte und Einsatz von ElephantDB
  • Speed-Layer: Berechnung und Speicherung von Echtzeit-Views
  • Einsatz von Hadoop, Apache Cassandra, Apache Kafka und Apache Storm
  • Streamverarbeitung mit Trident

Show description

Read Online or Download Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition) PDF

Similar data mining books

The Elements of Statistical Learning: Data Mining, Inference, and Prediction, Second Edition (Springer Series in Statistics)

In the past decade there was an explosion in computation and knowledge expertise. With it have come gigantic quantities of information in numerous fields corresponding to medication, biology, finance, and advertising. The problem of knowing those information has ended in the improvement of recent instruments within the box of information, and spawned new parts resembling facts mining, desktop studying, and bioinformatics.

Robust Cluster Analysis and Variable Selection (Chapman & Hall/CRC Monographs on Statistics & Applied Probability)

Clustering continues to be a colourful region of study in records. even though there are various books in this subject, there are rather few which are good based within the theoretical facets. In strong Cluster research and Variable choice, Gunter Ritter provides an outline of the idea and purposes of probabilistic clustering and variable choice, synthesizing the foremost study result of the final 50 years.

Machine Learning for the Web

Key FeaturesTargets immense and famous markets the place subtle internet apps are of want and value. functional examples of establishing computing device studying net program, that are effortless to keep on with and reflect. A accomplished educational on Python libraries and frameworks to get you up and commenced. booklet DescriptionPython is a basic objective and in addition a relatively effortless to profit programming language.

Proceedings of the International Congress on Information and Communication Technology: ICICT 2015, Volume 1 (Advances in Intelligent Systems and Computing)

This quantity comprises 69papers awarded at ICICT 2015: foreign Congress on info andCommunication know-how. The convention used to be held in the course of ninth and 10thOctober, 2015, Udaipur, India and arranged by means of CSI Udaipur bankruptcy, DivisionIV, SIG-WNS, SIG-e-Agriculture in organization with ACM Udaipur ProfessionalChapter, The establishment of Engineers (India), Udaipur neighborhood Centre and MiningEngineers organization of India, Rajasthan Udaipur bankruptcy.

Additional info for Big Data - Entwicklung und Programmierung von Systemen für große Datenmengen und Einsatz der Lambda-Architektur (mitp Professional) (German Edition)

Example text

Download PDF sample

Rated 4.00 of 5 – based on 11 votes