Pro Spark Streaming

Author: Zubair Nabi
Publisher: Apress
ISBN: 9781484214794
Release Date: 2016-06-13
Genre: Computers

Learn the right cutting-edge skills and knowledge to leverage Spark Streaming to implement a wide array of real-time, streaming applications. This book walks you through end-to-end real-time application development using real-world applications, data, and code. Taking an application-first approach, each chapter introduces use cases from a specific industry and uses publicly available datasets from that domain to unravel the intricacies of production-grade design and implementation. The domains covered in Pro Spark Streaming include social media, the sharing economy, finance, online advertising, telecommunication, and IoT. In the last few years, Spark has become synonymous with big data processing. DStreams enhance the underlying Spark processing engine to support streaming analysis with a novel micro-batch processing model. Pro Spark Streaming by Zubair Nabi will enable you to become a specialist of latency sensitive applications by leveraging the key features of DStreams, micro-batch processing, and functional programming. To this end, the book includes ready-to-deploy examples and actual code. Pro Spark Streaming will act as the bible of Spark Streaming. What You'll Learn Discover Spark Streaming application development and best practices Work with the low-level details of discretized streams Optimize production-grade deployments of Spark Streaming via configuration recipes and instrumentation using Graphite, collectd, and Nagios Ingest data from disparate sources including MQTT, Flume, Kafka, Twitter, and a custom HTTP receiver Integrate and couple with HBase, Cassandra, and Redis Take advantage of design patterns for side-effects and maintaining state across the Spark Streaming micro-batch model Implement real-time and scalable ETL using data frames, SparkSQL, Hive, and SparkR Use streaming machine learning, predictive analytics, and recommendations Mesh batch processing with stream processing via the Lambda architecture Who This Book Is For Data scientists, big data experts, BI analysts, and data architects.

Big Data in der Praxis

Author: Jonas Freiknecht
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 9783446456013
Release Date: 2018-06-11
Genre: Computers

Diese komplett überarbeitete Neuauflage bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und erfahren, wie Sie bestehende Systeme vorausschauend auf die mit Big Data einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu lernen. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit den Autoren bauen Sie Schritt für Schritt viele kleinere Projekte auf bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen Die zweite Auflage ergänzt das Buch um zahlreiche neue Themen wie Apache Spark, Apache Kafka und weitere Technologien, die vor allem darauf abzielen, Antwortzeiten kurz zu halten und so ein interaktives Arbeiten zu ermöglichen. Ebenso werden die für Firmen so wichtigen Themen Data Governance und Sicherheit behandelt. Im Internet: 18 fertige Beispiel-Projekte auf Basis von Hadoop, HBase, Hive und D3.js plus Videotutorials

Untersuchung und Bewertung cloud basierter Streaming Technologien zur Echtzeit Datenanalyse

Author: Christian Voigtländer
Publisher: diplom.de
ISBN: 9783961162277
Release Date: 2018-04-10
Genre: Computers

Das Internet sorgt für ein rasches Wachstum von verfügbaren Daten. Dem „EMC/IDC Digital Universe“ Report nach verdoppelt sich die Menge an Daten alle zwei Jahre. Es werden täglich eine Millionen Uber-Fahrten gebucht, monatlich 10 Milliarden Stunden Netflix-Videos konsumiert und jährlich eine Trillion US-Dollar auf E-Commerce-Webseiten ausgegeben. Dabei spielt der Umgang mit diesen Daten eine große Rolle für den Erfolg dieser Unternehmen. Insbesondere die Echtzeit-Datenanalyse hilft den Unternehmen, Kundenwünsche schnellstmöglich zu erkennen und diese auszuschöpfen. Ein weiterer Faktor des immensen Datenwachstums sind Web 2.0 Plattformen. In diesem Bereich sind die Benutzer der treibende Faktor für die stetig wachsende Datenflut dieser Plattformen, indem sie Beiträge veröffentlichen, Fotos teilen und Videos streamen. Beispielsweise sammelt Twitter 8 Terabyte, Facebook 500 Terabyte und Google 20 Terabyte an benutzergenerierten Daten täglich. Inhalte sind nicht länger statisch, sondern dynamisch. Diese Datenflut gilt es, zu kontrollieren. Unmittelbar nachdem Daten entstehen, haben sie den höchsten Wert. In der heutigen Zeit wird erwartet, Ergebnisse in schnellstmöglicher Zeit bereitzustellen. Analytische Prozesse werden in Minuten, Sekunden oder Bruchteilen von Sekunden durchgeführt, welche früher Monate, Tage oder Stunden gebraucht hätten. Aufgrund dieser Evolution der stetig neu entstehenden Daten müssen Veränderungen in der Art und Weise, wie diese Daten empfangen, transportiert, verarbeitet und analysiert werden, stattfinden. Die Technologie, die Echtzeit-Datenanalysen durchführt, wird in der vorliegenden Arbeit genauer betrachtet.

K nstliche Intelligenz f r Sales Marketing und Service

Author: Peter Gentsch
Publisher: Springer-Verlag
ISBN: 9783658191474
Release Date: 2017-10-07
Genre: Business & Economics

Dieses Buch zeigt, wie verschiedene Industrien von einer smarten Datennutzung mit Hilfe von Big Data Analytics und Künstlicher Intelligenz profitieren können. Dank der Künstlichen Intelligenz (KI) konnten in den letzten Jahren vor allem die Produktions- und Logistik-Prozesse vieler Unternehmen optimiert und automatisiert werden. Immer öfter werden jedoch auch administrative, dispositive und planerische Verfahren in Marketing, Sales und Management entwickelt, die den Weg hin zu einem ganzheitlichen Algorithmic Business ebnen. Mit diesem Buch präsentiert der Autor erstmals einen leicht verständlichen Praxisleitfaden, der systematisch die Technologien und Methoden der KI mit klaren Business-Szenarien und einem unternehmerischen Mehrwert verknüpft. Erfahren Sie u.a. wie Artificial Intelligence (AI) Ihr Pricing oder Ihre Produktempfehlungen automatisiert, Ihre Kundenkommunikation und Conversational Commerce übernimmt oder durch Customer Journey Analysen das Marketing Budget effizient verteilt. Lernen Sie, wie Sie über Daten Kunden- und Marktpotenziale identifizieren und Marktforschung intelligent optimieren können, um so die Kommunikation mit Bestandskunden zu verbessern und die Kundenzufriedenheit dauerhaft zu steigern. Entscheider im Marketing, Geschäftsführer und Vorstände finden in diesem Buch einen praktischen Leitfaden zur Einführung von Künstlicher Intelligenz in Management und Marketing - einer Einführung mit wenig Aufwand, geringen Kosten und zuverlässiger Planung effektiv umgesetzt werden kann. Machen Sie noch heute den ersten Schritt in Richtung Algorithmic Business. Prof. Dr. Peter Gentsch ist Entrepreneur und Experte im Bereich Digital Management und Big Data sowie Inhaber des Lehrstuhls für Internationale Betriebswirtschaftslehre an der HTW Aalen mit den Schwerpunkten CRM, E-Business und Digital Intelligence. Er ist Autor zahlreicher national und international ausgezeichneter Veröffentlichungen und Keynote-Speaker zu den Themen Digital Business Transformation und Innovationsmanagement. Mit Beiträgen von:Klaus Eck, d.Tales GmbH Prof. Dr. Martin Grothe, complexium GmbHProf. Dr. Nils Hafner, Hochschule Luzern Andreas Klug, ITyX Solutions AG Andreas Kulpa, DATAlovers AG Dr. Darko Obradovic, Insiders Technologies GmbHJens Scholz, prudsys AG Andreas Schwabe, Blackwood Seven Germany GmbHDr. Michael Thess, Signal Cruncher GmbH Dr. Thomas Wilde, BIG Social Media GmbH

Programmieren mit Scala

Author: Dean Wampler
Publisher: O'Reilly Germany
ISBN: 9783897216488
Release Date: 2010-10-31
Genre: Computers

Sie ist elegant, schlank, modern und flexibel: Die Rede ist von Scala, der neuen Programmiersprache für die Java Virtual Machine (JVM). Sie vereint die Vorzüge funktionaler und objektorientierter Programmierung, ist typsicherer als Java, lässt sich nahtlos in die Java-Welt integrieren – und eine in Scala entwickelte Anwendung benötigt oft nur einen Bruchteil der Codezeilen ihres Java-Pendants. Kein Wunder, dass immer mehr Firmen, deren große, geschäftskritische Anwendungen auf Java basieren, auf Scala umsteigen, um ihre Produktivität und die Skalierbarkeit ihrer Software zu erhöhen. Das wollen Sie auch? Dann lassen Sie sich von den Scala-Profis Dean Wampler und Alex Payne zeigen, wie es geht. Ihre Werkzeugkiste: Schon bevor Sie loslegen, sind Sie weiter, als Sie denken: Sie können Ihre Java-Programme weiter verwenden, Java-Bibliotheken nutzen, Java von Scala aus aufrufen und Scala von Java aus. Auch Ihre bevorzugten Entwicklungswerkzeuge wie NetBeans, IntelliJ IDEA oder Eclipse stehen Ihnen weiter zur Verfügung, dazu Kommandozeilen-Tools, Plugins für Editoren, Werkzeuge von Drittanbietern – und natürlich Ihre Programmiererfahrung. In Programmieren mit Scala erfahren Sie, wie Sie sich all das zunutze machen. Das Hybridmodell: Die Paradigmen "funktional" und "objektorientiert" sind keine Gegensätze, sondern ergänzen sich unter dem Scala-Dach zu einem sehr produktiven Ganzen. Nutzen Sie die Vorteile funktionaler Programmierung, wann immer sich das anbietet – und seien Sie so frei, auf die guten alten Seiteneffekte zu bauen, wenn Sie das für nötig halten. Futter für die Profis: Skalierbare Nebenläufigkeit mit Aktoren, Aufzucht und Pflege von XML mit Scala, Domainspezifische Sprachen, Tipps zum richtigen Anwendungsdesign – das sind nur ein paar der fortgeschrittenen Themen, in die Sie mit den beiden Autoren eintauchen. Danach sind Sie auch Profi im Programmieren mit Scala.

Big Data

Author: Daniel Fasel
Publisher: Springer-Verlag
ISBN: 9783658115890
Release Date: 2016-06-21
Genre: Computers

Dieser Herausgeber-Band bietet eine umfassende Einführung in das Gebiet Big Data. Neben einer Markteinschätzung und grundlegenden Konzepten (semantische Modellbildung, Anfragesprachen, Konsistenzgewährung etc.) werden wichtige NoSQL-Systeme (Key/Value Store, Column Store, Document Store, Graph Database) vorgestellt und erfolgreiche Anwendungen aus unterschiedlichen Perspektiven erläutert. Eine Diskussion rechtlicher Aspekte und ein Vorschlag zum Berufsbild des Data Scientist runden das Buch ab. Damit erhält die Leserschaft Handlungsempfehlungen für die Nutzung von Big-Data-Technologien im Unternehmen.

Big Data in der Praxis

Author: Jonas Freiknecht
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 9783446441774
Release Date: 2014-10-01
Genre: Computers

BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase

Vintage your life

Author: India Knight
Publisher: Goldmann Verlag
ISBN: 9783641555092
Release Date: 2011-05-10
Genre: Self-Help

Vintage – der neue, junge Trend – Selber machen ist in! Das Sparbuch für schicke Leute. Bestsellerautorin und Style-Expertin India Knight zeigt, wie man mit wenig Geld fabelhaft leben kann. Aus alten Klamotten schneidert sie Kissenbezüge, mit den Rezepten ihrer Mutter kocht sie Eingemachtes und aus Aspirin rührt sie das „beste Peeling aller Zeiten“. Treffend, urkomisch und überzeugend schreibt sie für alle, die ihr Budget entschlanken wollen, ohne dabei auf Luxus, Glamour und jede Menge Spaß zu verzichten. Mit diesem Buch gewinnt man einen frischen Blick auf den wahren Wert der Dinge und verliert nichts – außer den Schulden bei der Bank.

Big Data

Author: Viktor Mayer-Schönberger
Publisher: Redline Wirtschaft
ISBN: 9783864144592
Release Date: 2013-10-08
Genre: Political Science

Ob Kaufverhalten, Grippewellen oder welche Farbe am ehesten verrät, ob ein Gebrauchtwagen in einem guten Zustand ist – noch nie gab es eine solche Menge an Daten und noch nie bot sich die Chance, durch Recherche und Kombination in der Daten¬flut blitzschnell Zusammenhänge zu entschlüsseln. Big Data bedeutet nichts weniger als eine Revolution für Gesellschaft, Wirtschaft und Politik. Es wird die Weise, wie wir über Gesundheit, Erziehung, Innovation und vieles mehr denken, völlig umkrempeln. Und Vorhersagen möglich machen, die bisher undenkbar waren. Die Experten Viktor Mayer-Schönberger und Kenneth Cukier beschreiben in ihrem Buch, was Big Data ist, welche Möglichkeiten sich eröffnen, vor welchen Umwälzungen wir alle stehen – und verschweigen auch die dunkle Seite wie das Ausspähen von persönlichen Daten und den drohenden Verlust der Privatsphäre nicht.

Angst

Author: Robert Harris
Publisher: Heyne Verlag
ISBN: 9783641070557
Release Date: 2011-11-09
Genre: Fiction

Der beklemmend aktuelle Thriller von Bestsellergarant Robert Harris Für die Öffentlichkeit ist er ein Unbekannter, aber in den geheimen inneren Zirkeln der Superreichen ist Alex Hoffmann eine lebende Legende – ein visionärer Wissenschaftler, der eine Software entwickelt hat, die an den Börsen der Welt Milliardengewinne erzielt. Nun hat es jemand auf ihn abgesehen, und es beginnt für ihn eine albtraumhafte Zeit aus Angst und Schrecken. Kann er die Geister, die er rief, wieder loswerden? Oder stürzt er unaufhaltbar in den Abgrund – und mit ihm die Finanzmärkte der Welt?

Agiles Coaching

Author: Rachel Davies
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 9783826690464
Release Date: 2010
Genre:


Big Data Fast Data

Author: Michael Lex
Publisher:
ISBN: 9783868027396
Release Date: 2016-08-10
Genre: Computers

Die Big-Data-Welt verändert sich. Mit diesem shortcut erfahren Sie, was hinter den Begriffen Fast Data und SMACK steckt, wie Daten mittels Kafka und Akka ins System kommen und auf welche Art und Weise eine Datenanalyse mit Spark und Apache Zeppelin funktioniert. Im abschließenden Kapitel erläutern die Autoren, wie Daten unter Verwendung von Spark und Cassandra gespeichert, verarbeitet, aktualisiert und mit weiteren Informationen zusammengebracht werden können.

Data Science mit Python

Author: Jake VanderPlas
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 9783958456976
Release Date: 2017-11-24
Genre: Computers

Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

Android Apps mit App Inventor 2

Author: Karl-Hermann Rollke
Publisher: neobooks
ISBN: 9783742774897
Release Date: 2017-09-18
Genre: Computers

Mit der Entwicklungsumgebung App Inventor 2 kann man sehr einfach eigene Apps entwickeln und testen. Das Buch soll helfen, die ersten Schritte von der Einrichtung der Entwicklungsumgebung bis hin zu eigenen Apps zu bewältigen. Es ist an Anfänger gerichtet, die sich mit der App-Entwicklung beschäftigen wollen, läßt sich aber auch sehr gut zu Unterrichtszwecken in Schulen oder Volkshochschulen einsetzen. Es handelt sich um eine Schritt-für-Schritt Anleitung, die den Fokus nicht auf die vollständige Beschreibung der Programmiersprache legt, sondern an Beispielen die Möglichkeiten der Entwicklungsumgebung aufzeigt. Angefangen wird mit der Einrichtung der Umgebung und des Android-Geräts. Weiter geht es mit einfachen Apps, über Variablenkonzepte und Kontrollstrukturen zu komplexeren Themen. Es werden Ereignis gesteuerte Apps entwickelt, Unterprogramme behandelt und Sensoren abgefragt. Die Arbeit mit mehreren Bildschirmen spielt ebenso eine Rolle, wie Dateien und Dialoge. Die Beispiele sind so gewählt, dass die Themen mit ansteigendem Schwierigkeitsgrad möglichst systematisch behandelt werden. Die Beispiele sind nicht zu komplex, damit sie noch leicht verständlich bleiben. Sie sollen als Anregung für eigene Projekte dienen. Auf eine fachlich strenge Systematik und eine vollständige Beschreibung der Programmiersprache wird bewusst verzichtet, um Anfängerinnen und Anfänger nicht zu überfordern.

Big Data Apache Hadoop

Author: Lars George
Publisher:
ISBN: 9783868024005
Release Date: 2012-03-16
Genre: Computers

Doug Cutting hatte das Problem, das Internet (alles HTML) herunterzuladen und zu speichern. Was vor zehn Jahren schon eine Herausforderung war, ist heute, bei exponentiellem Anwachsen der Datenmenge, nicht einfacher. Es wurde Cutting schnell klar, dass die klassische Batch-Verarbeitung hier nicht ausreicht. Dann stieß er im Internet auf die Lösung: MapReduce. MapReduce beschreibt eine verteilte Ablaufumgebung, die grob gesagt in zwei Schritten aus Inputdaten neue Daten generiert. Cutting implementierte MapReduce Mitte des vergangenen Jahrzehnts als Open Source in Java und nannte das Projekt Hadoop. Eine Einführung in MapReduce, Hadoop und die Hadoop-Datenbank Apache-HBase sind die Kernthemen dieses shortcuts der Big-Data-Experten Bernd Fondermann, Kai Spichaale und Lars George.