Pro Spark Streaming

Author: Zubair Nabi
Publisher: Apress
ISBN: 9781484214794
Release Date: 2016-06-13
Genre: Computers

Learn the right cutting-edge skills and knowledge to leverage Spark Streaming to implement a wide array of real-time, streaming applications. This book walks you through end-to-end real-time application development using real-world applications, data, and code. Taking an application-first approach, each chapter introduces use cases from a specific industry and uses publicly available datasets from that domain to unravel the intricacies of production-grade design and implementation. The domains covered in Pro Spark Streaming include social media, the sharing economy, finance, online advertising, telecommunication, and IoT. In the last few years, Spark has become synonymous with big data processing. DStreams enhance the underlying Spark processing engine to support streaming analysis with a novel micro-batch processing model. Pro Spark Streaming by Zubair Nabi will enable you to become a specialist of latency sensitive applications by leveraging the key features of DStreams, micro-batch processing, and functional programming. To this end, the book includes ready-to-deploy examples and actual code. Pro Spark Streaming will act as the bible of Spark Streaming. What You'll Learn Discover Spark Streaming application development and best practices Work with the low-level details of discretized streams Optimize production-grade deployments of Spark Streaming via configuration recipes and instrumentation using Graphite, collectd, and Nagios Ingest data from disparate sources including MQTT, Flume, Kafka, Twitter, and a custom HTTP receiver Integrate and couple with HBase, Cassandra, and Redis Take advantage of design patterns for side-effects and maintaining state across the Spark Streaming micro-batch model Implement real-time and scalable ETL using data frames, SparkSQL, Hive, and SparkR Use streaming machine learning, predictive analytics, and recommendations Mesh batch processing with stream processing via the Lambda architecture Who This Book Is For Data scientists, big data experts, BI analysts, and data architects.

Untersuchung und Bewertung cloud basierter Streaming Technologien zur Echtzeit Datenanalyse

Author: Christian Voigtländer
Publisher: diplom.de
ISBN: 9783961162277
Release Date: 2018-04-10
Genre: Computers

Das Internet sorgt für ein rasches Wachstum von verfügbaren Daten. Dem „EMC/IDC Digital Universe“ Report nach verdoppelt sich die Menge an Daten alle zwei Jahre. Es werden täglich eine Millionen Uber-Fahrten gebucht, monatlich 10 Milliarden Stunden Netflix-Videos konsumiert und jährlich eine Trillion US-Dollar auf E-Commerce-Webseiten ausgegeben. Dabei spielt der Umgang mit diesen Daten eine große Rolle für den Erfolg dieser Unternehmen. Insbesondere die Echtzeit-Datenanalyse hilft den Unternehmen, Kundenwünsche schnellstmöglich zu erkennen und diese auszuschöpfen. Ein weiterer Faktor des immensen Datenwachstums sind Web 2.0 Plattformen. In diesem Bereich sind die Benutzer der treibende Faktor für die stetig wachsende Datenflut dieser Plattformen, indem sie Beiträge veröffentlichen, Fotos teilen und Videos streamen. Beispielsweise sammelt Twitter 8 Terabyte, Facebook 500 Terabyte und Google 20 Terabyte an benutzergenerierten Daten täglich. Inhalte sind nicht länger statisch, sondern dynamisch. Diese Datenflut gilt es, zu kontrollieren. Unmittelbar nachdem Daten entstehen, haben sie den höchsten Wert. In der heutigen Zeit wird erwartet, Ergebnisse in schnellstmöglicher Zeit bereitzustellen. Analytische Prozesse werden in Minuten, Sekunden oder Bruchteilen von Sekunden durchgeführt, welche früher Monate, Tage oder Stunden gebraucht hätten. Aufgrund dieser Evolution der stetig neu entstehenden Daten müssen Veränderungen in der Art und Weise, wie diese Daten empfangen, transportiert, verarbeitet und analysiert werden, stattfinden. Die Technologie, die Echtzeit-Datenanalysen durchführt, wird in der vorliegenden Arbeit genauer betrachtet.

Big Data in der Praxis

Author: Jonas Freiknecht
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 9783446456013
Release Date: 2018-06-11
Genre: Computers

Diese komplett überarbeitete Neuauflage bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und erfahren, wie Sie bestehende Systeme vorausschauend auf die mit Big Data einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu lernen. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit den Autoren bauen Sie Schritt für Schritt viele kleinere Projekte auf bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen Die zweite Auflage ergänzt das Buch um zahlreiche neue Themen wie Apache Spark, Apache Kafka und weitere Technologien, die vor allem darauf abzielen, Antwortzeiten kurz zu halten und so ein interaktives Arbeiten zu ermöglichen. Ebenso werden die für Firmen so wichtigen Themen Data Governance und Sicherheit behandelt. Im Internet: 18 fertige Beispiel-Projekte auf Basis von Hadoop, HBase, Hive und D3.js plus Videotutorials

Big Data in der Praxis

Author: Jonas Freiknecht
Publisher: Carl Hanser Verlag GmbH Co KG
ISBN: 9783446441774
Release Date: 2014-10-01
Genre: Computers

BIG DATA IN DER PRAXIS // - Für Analysten, BI-Verantwortliche, Data-Scientists, Consultants - Auf der DVD finden Sie: 18 fertige Projekte, die im Buch Schritt für Schritt entwickelt werden; Videotutorials u.a. zur Installation von Hadoop, Hive, HBase (Gesamtdauer: 80 Min.); Testdatensätze für die Wissensdatenbank Dieses Buch bringt Ihnen das Thema Big Data auf sehr praktische Art und Weise nahe. Sie lernen Technologien, Tools und Methoden kennen, entwickeln Beispiel-Lösungen und bekommen aufgezeigt, wie Sie bestehende Systeme vorausschauend auf die mit dem Big Data-Trend einhergehenden Herausforderungen vorbereiten. Dazu werden Sie neben den bekannten Apache-Projekten wie Hadoop, Hive und HBase auch einige weniger bekannte Frameworks wie Apache UIMA oder Apache OpenNLP kennenlernen, um gezielt die Verarbeitung unstrukturierter Daten zu behandeln. Alle hier verwendeten Software-Komponenten stehen im vollen Umfang kostenlos im Internet zur Verfügung. Gemeinsam mit dem Autor werden Sie ganz konkret Schritt für Schritt viele kleinere Projekte aufbauen bis hin zu einer fertigen und funktionstüchtigen Implementierung. Ziel des Buches ist es, Sie auf den Effekt und den Mehrwert der neuen Möglichkeiten aufmerksam zu machen, sodass Sie diese konstruktiv in Ihr Unternehmen tragen können und für sich und Ihre Kollegen somit ein Bewusstsein für den Wert Ihrer Daten schaffen. AUS DEM INHALT // Einführung rund um Big Data // Hadoop installieren, konfigurieren & bedienen // HDFS, Map-Reduce & YARN: Daten speichern und verarbeiten // Hadoop-Ecosystem: Überblick über dessen Komponenten // Einführung in NoSQL // HBase installieren, einrichten & auf Daten zugreifen // Data-Warehousing mit Apache Hive // HiveQL als Abfragesprache, Hive Security, Hive & JDBC // Datenimport aus relationalen Datenbanken mit Sqoop // Big Data-Visualisierung: Diagrammarten, Tipps & Trends // Visualisierungs-Frameworks im Vergleich // D3.js: Entwicklung einiger Beispieldiagramme // Entwicklung einer abschließenden Big Data-Analyse-Lösung // Troubleshooting für die Arbeit mit Hadoop, Hive & HBase

K nstliche Intelligenz f r Sales Marketing und Service

Author: Peter Gentsch
Publisher: Springer-Verlag
ISBN: 9783658191474
Release Date: 2017-10-07
Genre: Business & Economics

Dieses Buch zeigt, wie verschiedene Industrien von einer smarten Datennutzung mit Hilfe von Big Data Analytics und Künstlicher Intelligenz profitieren können. Dank der Künstlichen Intelligenz (KI) konnten in den letzten Jahren vor allem die Produktions- und Logistik-Prozesse vieler Unternehmen optimiert und automatisiert werden. Immer öfter werden jedoch auch administrative, dispositive und planerische Verfahren in Marketing, Sales und Management entwickelt, die den Weg hin zu einem ganzheitlichen Algorithmic Business ebnen. Mit diesem Buch präsentiert der Autor erstmals einen leicht verständlichen Praxisleitfaden, der systematisch die Technologien und Methoden der KI mit klaren Business-Szenarien und einem unternehmerischen Mehrwert verknüpft. Erfahren Sie u.a. wie Artificial Intelligence (AI) Ihr Pricing oder Ihre Produktempfehlungen automatisiert, Ihre Kundenkommunikation und Conversational Commerce übernimmt oder durch Customer Journey Analysen das Marketing Budget effizient verteilt. Lernen Sie, wie Sie über Daten Kunden- und Marktpotenziale identifizieren und Marktforschung intelligent optimieren können, um so die Kommunikation mit Bestandskunden zu verbessern und die Kundenzufriedenheit dauerhaft zu steigern. Entscheider im Marketing, Geschäftsführer und Vorstände finden in diesem Buch einen praktischen Leitfaden zur Einführung von Künstlicher Intelligenz in Management und Marketing - einer Einführung mit wenig Aufwand, geringen Kosten und zuverlässiger Planung effektiv umgesetzt werden kann. Machen Sie noch heute den ersten Schritt in Richtung Algorithmic Business. Prof. Dr. Peter Gentsch ist Entrepreneur und Experte im Bereich Digital Management und Big Data sowie Inhaber des Lehrstuhls für Internationale Betriebswirtschaftslehre an der HTW Aalen mit den Schwerpunkten CRM, E-Business und Digital Intelligence. Er ist Autor zahlreicher national und international ausgezeichneter Veröffentlichungen und Keynote-Speaker zu den Themen Digital Business Transformation und Innovationsmanagement. Mit Beiträgen von:Klaus Eck, d.Tales GmbH Prof. Dr. Martin Grothe, complexium GmbHProf. Dr. Nils Hafner, Hochschule Luzern Andreas Klug, ITyX Solutions AG Andreas Kulpa, DATAlovers AG Dr. Darko Obradovic, Insiders Technologies GmbHJens Scholz, prudsys AG Andreas Schwabe, Blackwood Seven Germany GmbHDr. Michael Thess, Signal Cruncher GmbH Dr. Thomas Wilde, BIG Social Media GmbH

Management digitaler Plattformen

Author: Manuel Wiesche
Publisher: Springer-Verlag
ISBN: 9783658212148
Release Date: 2018-04-19
Genre: Computers

Dieser Sammelband zum Projekt „ExCELL – Echtzeitanalyse und Crowdsourcing für intelligente City-Logistik“ zeigt das Potential von Smart Data für die Entwicklung intelligenter Mobilitätsdienste. Die Autoren beschreiben, wie datengetriebene Plattformen innovative Geschäftsmodelle ermöglichen und damit intelligente Mobilität und Logistik in Städten fördern.

Big Data

Author: Daniel Fasel
Publisher: Springer-Verlag
ISBN: 9783658115890
Release Date: 2016-06-21
Genre: Computers

Dieser Herausgeber-Band bietet eine umfassende Einführung in das Gebiet Big Data. Neben einer Markteinschätzung und grundlegenden Konzepten (semantische Modellbildung, Anfragesprachen, Konsistenzgewährung etc.) werden wichtige NoSQL-Systeme (Key/Value Store, Column Store, Document Store, Graph Database) vorgestellt und erfolgreiche Anwendungen aus unterschiedlichen Perspektiven erläutert. Eine Diskussion rechtlicher Aspekte und ein Vorschlag zum Berufsbild des Data Scientist runden das Buch ab. Damit erhält die Leserschaft Handlungsempfehlungen für die Nutzung von Big-Data-Technologien im Unternehmen.

Smart Mobility

Author: Barbara Flügge
Publisher: Springer-Verlag
ISBN: 9783658143718
Release Date: 2016-08-25
Genre: Computers

Das Herausgeberwerk bietet einen umfassenden Zugang zum Trendthema Smart Mobility: ausgehend von sozio-ökologischen und sozio-ökonomischen Aspekten der Mobilität, den Anforderungen von Anbietern und Nachfragern bis hin zu Mobilitätsansprüchen ganzer Ökosysteme und der Anwendbarkeit digitaler Lösungen für die Lebensbereiche jedes Einzelnen. Das Buch setzt wirkungsvoll die Ausgangssituation im Bereich Mobilität in Kontext mit den unterschiedlichsten Nutzungsszenarien und Initiativen. Die Leserschaft erhält einen Fahrplan für die Mobilität in Zeiten der Digitalisierung: Bausteine Intelligenter Mobilität (BIM), ein Vorgehensmodell und eine Reihe praxisorientierter Handlungsempfehlungen erleichtern die Analyse-, Planungs- und Umsetzungsphasen von Mobilitätsvorhaben.Die Beschreibungen erfolgen bewusst anschaulich und nachvollziehbar durch Checklisten und Anleitungen. Damit richtet sich das Buch an alle Entscheider, Innovationstreiber und Vordenker aus der Praxis, die sich mit dem Thema Mobilität beschäftigen – sei es im Personen- oder Frachtverkehr.

Praxishandbuch Big Data

Author: Joachim Dorschel
Publisher: Springer-Verlag
ISBN: 9783658072896
Release Date: 2015-04-15
Genre: Law

Dieses Praxishandbuch bietet einen Überblick der möglichen Anwendungsfelder und der rechtlichen Rahmenbedingungen von Big Data im Unternehmen. Im ersten Teil wird gezeigt, wie Entscheidungsprozesse mit Daten fundiert werden können und welche Anwendungsmöglichkeiten in verschiedenen Branchen denkbar sind. Der zweite Teil behandelt die rechtlichen Aspekte von Big Data. Die Autoren geben praktische Empfehlungen, wie Big Data-Anwendungen nach geltendem Recht umgesetzt werden können und dabei den technischen und organisatorischen Aufwand so gering wie möglich zu halten. Auch wird erläutert, wie Unternehmen ihre Datenbestände schützen können. Der dritte Teil beschäftigt sich mit den technischen Voraussetzungen von Big Data-Anwendungen.

Agiles Coaching

Author: Rachel Davies
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 9783826690464
Release Date: 2010
Genre:


Data Science mit Python

Author: Jake VanderPlas
Publisher: MITP-Verlags GmbH & Co. KG
ISBN: 9783958456976
Release Date: 2017-11-24
Genre: Computers

Die wichtigsten Tools für die Datenanalyse und-bearbeitung im praktischen Einsatz Python effizient für datenintensive Berechnungen einsetzen mit IPython und Jupyter Laden, Speichern und Bearbeiten von Daten und numerischen Arrays mit NumPy und Pandas Visualisierung von Daten mit Matplotlib Python ist für viele die erste Wahl für Data Science, weil eine Vielzahl von Ressourcen und Bibliotheken zum Speichern, Bearbeiten und Auswerten von Daten verfügbar ist. In diesem Buch erläutert der Autor den Einsatz der wichtigsten Tools. Für Datenanalytiker und Wissenschaftler ist dieses umfassende Handbuch von unschätzbarem Wert für jede Art von Berechnung mit Python sowie bei der Erledigung alltäglicher Aufgaben. Dazu gehören das Bearbeiten, Umwandeln und Bereinigen von Daten, die Visualisierung verschiedener Datentypen und die Nutzung von Daten zum Erstellen von Statistiken oder Machine-Learning-Modellen. Dieses Handbuch erläutert die Verwendung der folgenden Tools: ● IPython und Jupyter für datenintensive Berechnungen ● NumPy und Pandas zum effizienten Speichern und Bearbeiten von Daten und Datenarrays in Python ● Matplotlib für vielfältige Möglichkeiten der Visualisierung von Daten ● Scikit-Learn zur effizienten und sauberen Implementierung der wichtigsten und am meisten verbreiteten Algorithmen des Machine Learnings Der Autor zeigt Ihnen, wie Sie die zum Betreiben von Data Science verfügbaren Pakete nutzen, um Daten effektiv zu speichern, zu handhaben und Einblick in diese Daten zu gewinnen. Grundlegende Kenntnisse in Python werden dabei vorausgesetzt. Leserstimme zum Buch: »Wenn Sie Data Science mit Python betreiben möchten, ist dieses Buch ein hervorragender Ausgangspunkt. Ich habe es sehr erfolgreich beim Unterrichten von Informatik- und Statistikstudenten eingesetzt. Jake geht weit über die Grundlagen der Open-Source-Tools hinaus und erläutert die grundlegenden Konzepte, Vorgehensweisen und Abstraktionen in klarer Sprache und mit verständlichen Erklärungen.« – Brian Granger, Physikprofessor, California Polytechnic State University, Mitbegründer des Jupyter-Projekts

Big Data

Author: Rosangela Marquesone
Publisher: Editora Casa do Código
ISBN: 9788555192326
Release Date: 2016-12-02
Genre: Computers

Estamos na era dos dados. Não importa qual seja a sua área de atuação, uma palavra atualmente em evidência é: Big Data. Podemos encontrar casos de uso em que esse conceito permitiu a redução do número de fraudes, redução de custos na produção, eficiência energética, aumento de segurança, entre outros benefícios tão almejados em diversos domínios. Muito embora o interesse esteja em alta, Big Data ainda é um termo incipiente, gerando incertezas sobre sua definição, características, aplicabilidade e desafios. Como obter dados de diferentes fontes? Como extrair valor a partir dos dados? Qual a infraestrutura necessária para criar uma solução de Big Data? Quais habilidades são necessárias para atuar com Big Data em seu projeto? Neste livro, Rosangela Marquesone apresenta as tecnologias e soluções de Big Data, em uma abordagem conceitual que detalha as características e capacidades de cada uma delas. Você verá as principais fases de um projeto de Big Data, desde a captura, o armazenamento, o processamento, análise, até a visualização de dados.

Das gro e Magic Cleaning Buch

Author: Marie Kondo
Publisher: Rowohlt Verlag GmbH
ISBN: 9783644404427
Release Date: 2018-03-13
Genre: Self-Help

Der neue Weltbestseller der japanischen Expertin für glückliches Wohnen. «Die Unordnung im Zimmer entspricht der Unordnung im Herzen», sagt ein japanisches Sprichwort. Marie Kondo weiß das und hat mit ihrer gefeierten Methode das Leben von Millionen Menschen weltweit verändert. Das Geheimnis ist, sich auf die Dinge zu konzentrieren, die man mag, und die anderen loszuwerden. Nun präsentiert sie einen allumfassenden, schön illustrierten Kursus. Ihre Schritt-für-Schritt-Anleitungen helfen beim Aufräumen von Kleidung, Schuhen, Büchern und Papieren, Kosmetik, Kochutensilien und sogar Dingen mit sentimentalem Wert. Außerdem zeigt sie, wie wir perfekt Schubladen und Schränke organisieren. Durch die richtige Ordnung in unseren Wohnzimmern, Küchen, Büros, Schlafzimmern und Badezimmern wird so unser gesamtes Leben einfacher, und wir werden zufrieden und glücklicher.

Programmieren mit Scala

Author: Dean Wampler
Publisher: O'Reilly Germany
ISBN: 9783897216488
Release Date: 2010-10-31
Genre: Computers

Sie ist elegant, schlank, modern und flexibel: Die Rede ist von Scala, der neuen Programmiersprache für die Java Virtual Machine (JVM). Sie vereint die Vorzüge funktionaler und objektorientierter Programmierung, ist typsicherer als Java, lässt sich nahtlos in die Java-Welt integrieren – und eine in Scala entwickelte Anwendung benötigt oft nur einen Bruchteil der Codezeilen ihres Java-Pendants. Kein Wunder, dass immer mehr Firmen, deren große, geschäftskritische Anwendungen auf Java basieren, auf Scala umsteigen, um ihre Produktivität und die Skalierbarkeit ihrer Software zu erhöhen. Das wollen Sie auch? Dann lassen Sie sich von den Scala-Profis Dean Wampler und Alex Payne zeigen, wie es geht. Ihre Werkzeugkiste: Schon bevor Sie loslegen, sind Sie weiter, als Sie denken: Sie können Ihre Java-Programme weiter verwenden, Java-Bibliotheken nutzen, Java von Scala aus aufrufen und Scala von Java aus. Auch Ihre bevorzugten Entwicklungswerkzeuge wie NetBeans, IntelliJ IDEA oder Eclipse stehen Ihnen weiter zur Verfügung, dazu Kommandozeilen-Tools, Plugins für Editoren, Werkzeuge von Drittanbietern – und natürlich Ihre Programmiererfahrung. In Programmieren mit Scala erfahren Sie, wie Sie sich all das zunutze machen. Das Hybridmodell: Die Paradigmen "funktional" und "objektorientiert" sind keine Gegensätze, sondern ergänzen sich unter dem Scala-Dach zu einem sehr produktiven Ganzen. Nutzen Sie die Vorteile funktionaler Programmierung, wann immer sich das anbietet – und seien Sie so frei, auf die guten alten Seiteneffekte zu bauen, wenn Sie das für nötig halten. Futter für die Profis: Skalierbare Nebenläufigkeit mit Aktoren, Aufzucht und Pflege von XML mit Scala, Domainspezifische Sprachen, Tipps zum richtigen Anwendungsdesign – das sind nur ein paar der fortgeschrittenen Themen, in die Sie mit den beiden Autoren eintauchen. Danach sind Sie auch Profi im Programmieren mit Scala.

Active Office

Author: Josef Glöckl
Publisher: Springer-Verlag
ISBN: 9783658075163
Release Date: 2015-02-10
Genre: Business & Economics

Ein „moderner“ Arbeitsplatz soll schnell, vernetzt, bequem sein: Informationen, Dienstleistungen und Waren idealerweise nur ein Mausklick entfernt. Was sich zunächst gut anhört, verlangt dem Menschen viel ab: seine Gesundheit – verursacht durch massiven und andauernden Bewegungsmangel. Im „Active Office“, dem Büro der Zukunft, verbringt der Mensch den Büroalltag in Bewegung. Das Konzept ist evolutionär und revolutionär zugleich: Es kombiniert Erkenntnisse aus der Anthropologie, Biochemie, Osteopathie, Psychologie, klinischer Psycho-Neuro-Immunologie und Bewegungslehre. Es ist höchste Zeit für eine Revolution im Büro . Mit dem „Active Office“ und seinen 11 Elemente wird es möglich, in der modernen Arbeitswelt gesund, leistungsfähig und im Einklang mit der menschlichen Natur zu leben und zu arbeiten. Ein einzigartiger Ansatz, der über die gut gemeinten Empfehlungen von Medizinern, Berufsgenossenschaften, Krankenkassen und der Büromöbelindustrie bei weitem hinausgeht.