Direkt zum Inhalt

Maths2Mind Navigation

      • Terme und Zahlensysteme
      • Fest- und Gleitkommadarstellung, Zehnerpotenzen, SI-Präfixe
      • Teiler bzw Vielfache
      • Brüche und Rundungsregeln
      • Kartesische-, trigonometrische bzw. exponentielle Darstellung
      • Rechenoperationen mit komplexen Zahlen
      • Fundamentalsatz der Algebra
      • Quadratische Gleichungen mit komplexer Lösung
      • Die Schönheit der Fraktale und der Selbstähnlichkeit
      • Potenzieren
      • Wurzelziehen
      • Logarithmieren
      • Determinante
      • Matrizen
      • Lineare Gleichung mit einer Variablen
      • Quadratische Gleichung mit einer Variablen
      • Lineare Gleichungssyteme mit zwei Variablen
      • Lineare Ungleichung mit einer Variablen
      • Lineare Ungleichung mit zwei Variablen
      • Systeme linearer Ungleichungen mit einer Variablen
      • Systeme linearer Ungleichungen mit zwei Variablen
      • Quadratische Ungleichungen mit einer Variablen
      • Zahlenfolgen und Zahlenreihen
      • Modellbildung, Simulation
      • Zuordnungen
      • Eigenschaften einer Funktion
      • Lineare Funktion
      • Quadratische Funktionen (Parabel)
      • Polynomfunktionen
      • Gebrochenrationale Funktionen (Hyperbel)
      • Wurzelfunktionen
      • Potenzfunktionen
      • Exponentialfunktion
      • Logarithmusfunktion
      • Periodische Funktionen
      • Änderungsmaße
      • Differenzierbarkeit
      • Ableitungsfunktionen und Ableitungsregeln
      • Lineare Optimierung
      • Differentialgleichungen
      • Unbestimmtes Integral
      • Bestimmtes Integral
      • Stammfunktionen und Integrationsregeln
      • Numerische Integration
      • Integro-Differentialgleichungen
      • Geometrische Grundbegriffe
      • Koordinatensysteme
      • Ähnlichkeit und Kongruenz
      • Dreiecke
      • Vierecke
      • Polygone
      • Kreis, Kreissektor und Kreisbogen
      • Würfel, Quader, Prisma
      • Zylinder und Zylinderstumpf
      • Pyramide und Pyramidenstumpf
      • Kegel und Kegelstumpf
      • Kugel und Kugelkalotte
      • Winkel- und Arkusfunktionen
      • Hyperbel- und Areafunktionen
      • Vektoren
      • Vektoralgebra
      • Vektoranalysis
      • Gleichungen von Punkt, Gerade und Ebene
      • Gleichungen von Kreis, Kugel und Kegelschnitten
      • Kombinatorik
      • Beschreibende Statistik - Lagemaße
      • Beschreibende Statistik - Streumaße
      • Schließende Statistik - Wahrscheinlichkeitsrechnung
      • Explorative Statistik - Data Mining
      • Aussagen
      • Mengen
      • Prüfungsteil A - Analysis
      • Prüfungsteil A - Stochastik
      • Prüfungsteil A - Geometrie
      • Prüfungsteil B - Analysis
      • Prüfungsteil B - Stochastik
      • Prüfungsteil B - Geometrie
      • Typ 1 - Algebra und Geometrie
      • Typ 1 - Analysis
      • Typ 1 - Funktionale Abhängigkeiten
      • Typ 1 - Wahrscheinlichkeit und Statistik
      • Typ 2 - Vernetzung der Grundkompetenzen
      • Teil A Aufgaben für alle Cluster
      • Teil B Aufgaben für spezielle Cluster
      • Zins- und Zinseszinsrechnung
      • Prozent- und Promillerechnung
      • Rentenrechnung
      • Kosten- und Preistheorie
      • Investitionsrechnung
      • Künstliche Intelligenz
      • GeoGebra
      • Berechnung von Gleichstromkreisen
      • Berechnung von Wechselstromkreisen
      • Berechnung von Drehstromsystemen
      • Elektromagnetische Felder
      • Komponenten elektrischer Energienetze
      • Fourier Analyse
      • Basiseinheiten der Physik und die Naturkonstanten
      • Mechanik
      • Thermodynamik
      • Relativitätstheorien
      • Atom- und Kernphysik
      • Strahlen- und Wellentheorie des Lichtes
      • Vom Photon zum Photo
      • Photovoltaik
      • Quantenphysik
      • Standardmodell der Kosmologie
      • Standardmodell der Elementarteilchen
      • Die 4 Wechselwirkungen und der Higgs Mechanismus
      • Recruiting & Branding
      • Zusammenarbeit mit LehrerInnen und Dozenten
      • Angeleitetes autonomes Lernen
      • Testbilder
      • Taxonomie
Maths2Mind

Social Media

User account menu

  • Anmelden
Kritik, Lob, Wünsche oder Verbesserungsvorschläge?
Nehmt Euch kurz Zeit, klickt hier und schreibt an
feedback@maths2mind.com
Deine Meinung ist uns wichtig!
/contact?edit%5Bsubject%5D%5Bwidget%5D%5B0%5D%5Bvalue%5D=Nutzerfeedback

Pfadnavigation

  1. Maths2Mind
  2. Stochastik
  3. Kombinatorik, Statistik und Data Mining
  4. Explorative Statistik - Data Mining

Explorative Statistik - Data Mining

Hier findest du folgende Inhalte

2
Formeln
    Formeln
    Wissenspfad

    Explorative Statistik - Data Mining - Big Data

    Big Data steht für den Umgang mit großen Datenvolumen (Big Data), vor allem mit besonders großen, dynamischen, schnelllebigen und/oder komplexen Massendaten, gewonnen aus einer zunehmend automatisierten dezentralen Datenerfassung (IoT), die mit den Mitteln der konventionellen Datenverarbeitung (etwa in Data Warehouse Systemen) nicht mehr verarbeitet werden können, weil eine vorab Aufbereitung der Daten (Data Cleansing), wie sie für Data Warehouse Systeme erforderlich sind, zu aufwendig wäre.

    Es kommen daher neuartige (Cloud) Betriebssysteme, (Cloud) Datenspeicher und spezielle Prinzipien zur Analyse großer Datenmengen zur Anwendung, die etwa das Ziel von zusätzlichem Produktivitätswachstum verfolgen. Für die Datensicherheit und damit für die Akzeptanz von Cloud Systemen ist die Unterscheidung in private (das Unternehmen hostet die Daten im eigenen Rechenzentrum) bzw. public (AWS, Azure,..) Cloud Systeme entscheidend.

    Welchen Wissensgewinn hat ein Unternehmen, den es vorher nicht hatte, bzw. was kann wirtschaftlicher erledigt werden als zuvor, wenn es in Big Data und Data Science investiert? Der Einstieg in Big Data setzt die Bereitschaft voraus, technische, rechtliche und organisatorische Möglichkeiten zu schaffen, große Datenmengen zu sammeln, abzuspeichern und zu verarbeiten. Damit diese Bereitschaft bei den Stakeholdern überhaupt entsteht, muss der Zweck bzw. der Sinn dahinter transparent gemacht werden.


    Data Driven Decision Making

    Datengestützte Entscheidungsfindung bezeichnet Entscheidungen, deren Basis vorangehende Datenanalysen sind


    Data Science

    Data Science beschäftigt sich mit Prinzipien, um Wissen aus Daten zu extrahieren und nützt dafür Data Mining

    Der zeitliche Ablauf vom Data Science sieht wie folgt aus:

    • Fragestellung so festlegen, dass die prognostizierten Erkenntnisse Basis für Management-Entscheidungen darstellen können
    • Einflussgrößen und Einschränkungen identifizieren und gewichten
    • Datenquellen identifizieren sowie erschließen und Datenqualität sicherstellen
    • Dezentrale Daten erheben und zentral speichern
    • Kennzahlen für die Güte und Genauigkeit zum Zweck der Bewertung der Resultate festlegen
    • Data Mining: Teilaufgaben definieren, passenden toolgestützten Auswertealgorithmus wählen und anwenden, Erkenntnisse extrahieren, Resultate visualisieren, an den Kennzahlen benchmarken und interpretieren
    • Nachträglicher rückblickender Vergleich der Prognose mit der eingetretenen Realität
    • Data Driven Decison Making = Managemententscheidungen ableiten

    Data Mining Techniken

    Data Mining Techniken umfassen konkrete Verfahren und Vorgehensweisen, um Muster in Daten zu finden und dasjenige Wissen aus den Daten zu extrahieren, welches valide, bisher unbekannt und potentiell nützlich ist.

    Gängige Data Mining Techniken umfassen Klassifikations- und Abhängigkeitsanalysen


    Klassifikationsanalyse

    Bei der Klassifikationsanalyse werden bereits vorhandene Ereignisse gemäß ihren qualitativen oder quantitativen Merkmalen zu Klassen (deren Zugehörigkeit einander ausschließt) zusammen gefasst. Bei der Klassifikationsanalyse erfolgt die Zuordnung von einem neuen Ereignis zu einer der bestehenden Klassen z.B. mit Hilfe eines Entscheidungsbaums. (Beispiel: Alter → Einkommen → bestehende Schulden → Kreditwürdig ja/nein)

    • Entscheidungsbaum: Knoten entspricht Entscheidungskriterium; Blatt entspricht Entscheidung
    • Gini Index: Minimierung der Heterogenität
    • Chi-Quadrat Test

    Abhängigkeitsanalyse

    Bei der Abhängigkeitsanalyse wird z.B. mit Hilfe von „Wenn-Dann“ Regeln nach Abhängigkeiten gesucht. (Beispiel: Wenn Kunde schon Grillkohle und Steak gekauft hat → dann wird der Kunde auch Bier kaufen). Ihr Einsatz bietet sich beispielsweise in Empfehlungssystemen an (Kunden die „A“ gekauft haben, kauften auch gerne „B“)

    • Regressionsanalyse: Analysiert die Beziehung von einem unabhängigem und einem kausal abhängigen Merkmal.

      • Einfache Lineare Regression - Berechnung vom Regressionskoeffizienten
      • Multivariante lineare Regression
      • Nichtlineare Regression (Maximum-Likehood-Methode) ermittelt den Regressionskoeffizienten so, dass sich eine maximale Auftretenswahrscheinlichkeit ergibt.
    • Korrelationsanalyse: Beschreibt mittels Kovarianz und Korrelationskoeffizienten den linearen Zusammenhang zwischen 2 Merkmalen und wie stark dieser Zusammenhang ist. Sie trifft keine Aussage über einen kausalen Zusammenhang der beiden Merkmale
    • Assoziationsanalyse: Die analysierten Daten werden auf Abhängigkeiten hin analysiert, wobei die Prämisse (das ist eine Regel) eine Kombination von Ereignissen die unabhängigen Variablen betreffend, zu einer Konklusion die abhängigen Variablen betreffend führt. Unter einer Transaktion versteht man Summe aller gemeinsam vorkommenden Ereignisse. Die Assoziationsregeln werden mit den Gütekriterien Konfidenz (Stärke des Zusammenhangs gemäß der Regel) und Support (relative Häufigkeit eines Ereignisses an der Datenbasis) bewertet. Algorithmen zur Erstellung von Assoziationsregeln sind
      • Der Apriori Algorithmus
      • Der FP-Growth, der mit dem Frequent Pattern Tree arbeitet, der aus Transaktionen aufgebaut wird.
    • Clustering: Lassen sich vorab keine Klassen identifizieren (z.B. im Bereich der Ideenfindung) so werden beim Clustering die Daten so in „Anhäufungen/Gruppen“ von ähnlichen Merkmalen eingeteilt (z.B. in 4-Quadraten), dass mathematisch gesprochen die Summe der quadrierten Abweichungen von den Gruppenschwerpunkten ein Minimum annimmt. (k-Means-Algorithmus). Clustering kann dazu verwendet werden, große Datenmengen auf wenige, einander aber ähnliche „repräsentative“ Daten zu reduzieren.
      • k-Means Clustering: \({\sum\limits_{i = 1}^n {\sum\limits_{j = 1}^k {\left| {{x_{ij}} - {c_j}} \right|} } ^2}\) wobei der Term zwischen den Betragszeichen dem Abstand vom Datenpunkt i zum Clusterzentrum j definiert und \(i \gg j\) gilt.

    Big Data Toolsets

    • Python: Programmiersprache, speziell um große Datenmengen zu sammeln, zu strukturieren, zu analysieren und zu visualisieren.
    • Scipy: Python basierte Software für wissenschaftliche Berechnungen
    • NumPy: Python basierte Software zur Bearbeitung von array-basierten Daten wie Matrizen
    • Pandas: Python basierte Software zur Bearbeitung von Zeitreihen
    • MatPlotLib: Python basierte Software zur Datenvisualisierung
    • Hadoop: Frei verfügbares Java Framework, basierend auf dem MapReduce Algorithmus von Google, welches es ermöglicht, Datenanalysen im PetaByte Bereich (1015 Byte) auf verteilten skalierbaren Computerclustern durchzuführen.
    • HBase: Spaltenorientiertes nicht rationales Datenbanksystem, mit spezieller Unterstützung für performante Datenverarbeitung auf Hadoop basierten Plattformen
    • MongoDB: Weit verbreitete dokumentenorientierte , nahezu unbegrenzt skalierbare Non-SQL Datenbank zur Verwaltung und nachfolgender Analyse von JSON basierten Dokumenten auf Node.js Plattformen
    Big Data
    Explorative Statistik
    Data Science
    Data Mining
    Data Driven Decison Making
    Big Data Toolset
    Fragen oder Feedback

    Schon den nächsten Urlaub geplant?
    Auf maths2mind kostenlos auf Prüfungen vorbereiten!
    Nach der Prüfung mit dem gesparten Geld deinen Erfolg genießen.

    Startseite
    Bild
    Illustration Buch mit Cocktail 1050 x 450
    Startseite
    Wissenspfad

    Cloud Betriebssysteme

    Ein Cloud OS dient zum Betrieb von Servern, Datenspeichern, Netzwerkkomponenten und Applikationen in Form einer virtualisierten IT-Infrastruktur und deren grundsätzlicher Unabhängigkeit vom tatsächlichen physikalischen Standort der HW. Bei Public Cloud Systemen teilen sich verschiedene Anwendungen die IT-Infrastruktur, ohne von der jeweils anderen Anwendung konkret etwas zu wissen, wodurch die Ressourcen optimal ausgelastet werden können und Preisvorteile gegenüber Private Cloud Systemen mit ihrer dedizierten HW entstehen. Der Betreiber vom Cloud Service garantiert seinen Kunden die vorher vereinbarte Verfügbarkeit, Performance und Sicherheit in Form von einem SLA (Service Level Agreement).

    Beispiele für Cloud Betriebssysteme sind:

    • Windows Azure von Microsoft
    • Google App Engine von Google
    • vSphere von VMware
    • OpenStack von OpenStack Foundation
    • MindSphere das IoT-Betriebssystem von Siemens

    Beispiele für Cloud-Plattformen

    • AWS Amazon Web Services von Amazon
    • Azure von Microsoft
    • Bluemix von IBM
    • G Suite von Google

    Private vs. Public Cloud

    Data Mining basiert auf der IT-gestützten Verarbeitung großer Datenmengen, die aus Kostengründen bevorzugt cloudbasiert gehostet werden. dabei unterscheidet man in


    Private Cloud

    • On Premise Private Cloud: Die Cloud wird vor Ort auf Servern des Unternehmens installiert, welches die exklusiven Nutzungsrechte inne hat. Vorteil: Sehr sicher; Nachteil: Keine CAPEX oder OPEX Kostenteilung, mangelnde Ausfallsicherheit.
    • Hosted Solution: Die Cloud wird auf physikalisch benennbaren Servern eines spezialisierten 3rd Party Service Providers gehostet und exklusiv von einem Unternehmen genutzt. Man spricht auch von „Dedizierten Servern“. Vorteil: Hohe Skalierbarkeit, verlagert einen Teil der CAPEX auf den Service Provider.

    Public Cloud

    Mehrere Unternehmen teilen sich eine Infrastruktur, die bei einem spezialisierten 3rd Party Service Provider gehostet wird. Bezahlt wird abhängig vom individuellen Nutzungsgrad pro Abrechnungsperiode. Vorteil: reduziert CAPEX und OPEX. Der Eigentümer der Daten weiß aber nicht mehr auf genau welcher HW seine Daten gehostet werden. Er kann zum Bespiel nur mehr sagen "innerhalb der EU".

    Cloud Betriebssystem
    Private vs. Public Cloud
    Fragen oder Feedback

    maths2mind®

    Kostenlos und ohne Anmeldung
    Lehrstoff und Aufgabenpool

    verständliche Erklärungen
    schneller Lernerfolg
    mehr Freizeit

    /
    Bild
    Illustration - Lady with Laptop
    /

    Maths2Mind ist ein einzigartiges Angebot, einerseits zur Mathematik-Matura bzw. Abiturvorbereitung, andererseits zur Vermittlung eines breiten Grundlagenwissens zu den MINT-Fächern Mathematik, Elektrotechnik und Physik, das sich von anderen Online-Ressourcen abhebt.

    Hier sind einige der wesentlichen Alleinstellungsmerkmale von maths2mind.com:

    • Kostenlose Prüfungsvorbereitung: Nicht jede Familie kann es sich leisten, für Prüfungsvorbereitung zu bezahlen. Nutzer von maths2mind benötigen keine Kreditkarte, da es keine kostenpflichtigen Abonnementpakete gibt. Alle Inhalte sind kostenlos zugänglich!
    • Privatsphäre: Es werden keine zustimmungspflichtigen Cookies verwendet, es gibt keine webseitenübergreifende oder personalisierte Werbung. 
    • Anonymes Lernen: Alle Inhalte sind ohne Anmeldung zugänglich, sodass Schüler anonym lernen können.
    • Autoren Dream-Team: Die Inhalte werden von Experten mit facheinschlägigem Universitätsabschluss erstellt. Zusätzlich erfolgte eine Recherche auf Vollständigkeit mittels künstlicher Intelligenz.
    • Probeschularbeiten: Lehrer können bei jeder Aufgabe einen Link kopieren, und durch simples "kopieren - einfügen" eine Probeschularbeit zusammenstellen und diese ihren Schülern elektronisch zum Selbststudium verfügbar machen.
    • Verständliche Erklärungen – schneller Lernerfolg – mehr Freizeit: Ehemalige Matura- bzw. Abiturbeispiele werden schriftlich vorgerechnet, damit Schüler den vollständigen Rechenweg 1:1 nachvollziehen können. Die ehemaligen Aufgaben sind sowohl chronologisch nach Prüfungstermin, als auch inhaltlich nach Lehrstoff sortiert, mittels anklickbarer Tags auffindbar.
    • Vernetzung von Lehrstoff und Rechenaufgaben über Tags: "Aufgaben passend zum Lernstoff" oder "Grundlagenwissen zur jeweiligen Aufgabe" sind mittels Tags leicht zu finden.
    • 1.000 Videos zum Rechenweg: Auch Dank der freundlichen Genehmigung des Bundesministeriums für Bildung, binden wir direkt in den Lösungsweg von Maturabeispielen, videobasierte Erklärungen ein.
    • 4.000 MINT-Fachbegriffe: Nutzer können gezielt nach Fachbegriffen suchen. Bei mehreren Treffern erfolgt die Auswahl über stichwortartige Zusammenfassungen.
    • 2.000 GeoGebra Illustrationen: Alle unsere rd. 2.000 selbst erstellten vektorbasierten Grafiken wurden mit GeoGebra erstellt. Zusätzlich verlinken wir auf anschauliche interaktive Illustrationen auf der GeoGebra Lernplattform.
    • Exzellent lesbare MINT-Inhalte: Die Inhalte sind vektorbasiert und daher auf allen Geräten, vom Smartphone bis zum XXL-Screen, gestochen scharf lesbar. Das gilt besonders für komplexe Formeln und anschauliche Illustrationen.
    • Wissenspfade: Zu jeder Lerneinheit werden gut strukturiert empfohlenes Vorwissen, verbreiterndes und vertiefendes Wissen angezeigt.
    • Umfassende Unterstützung: Maths2mind begleitet Schüler bis zum erfolgreichen Lehrabschluss mit Matura, dem Berufseinstieg nach Matura/Abitur und auch beim Studieneinstieg.
    • Soziale Mission: Als E-Learning Plattform mit sozialer Mission bietet maths2mind Chancen-Fairness durch genderneutralen Bildungszugang. Unabhängig von sozioökonomischem Umfeld, Wohnort, Einstellung oder Kulturkreis der Eltern, Sympathiewert des Lehrenden, finanzieller Schulausstattung oder Tagespolitik.
    • Kostenlose Fragen per E-Mail: Bei Unklarheiten können Fragen kostenlos per E-Mail gestellt werden.

    Maths2Mind.com ist somit eine umfassende Plattform, die nicht nur Wissen vermittelt, sondern auch auf individuelle Bedürfnisse eingeht und einen fairen Zugang zur Bildung ermöglicht.

    /

    Fußzeile

    • FAQ
    • Über maths2mind
    • Cookie Richtlinie
    • Datenschutz
    • Impressum
    • AGB
    • Blog

    © 2022 maths2mind GmbH