Algorithmen und Modelle im maschinellen Lernen
Formel
Algorithmen und Modelle im maschinellen Lernen
Algorithmus
Ganz allgemein beschreibt ein Algorithmus mittels einer Handlungsvorschrift, wie aus einer Eingabe eine Ausgabe wird.
Eingabe → Verarbeitung gemäß Algorithmus → Ausgabe
Ein Kochrezept ist ein praktisches Beispiel für einen Algorithmus. Es ist eine Schritt-für-Schritt Anleitung, lässt aber persönliche Präferenzen und Freiheiten zu, da man bestimmte Zutaten auch durch andere Zutaten ersetzen kann und nicht jeder Koch unter einer Prise Salz dieselbe Menge an Salz versteht.
Beim maschinellen Lernen ist ein Algorithmus eine systematische und geordnete Abfolge von Schritten bzw. Anweisungen an einen Computer, die präzise ausgeführt werden müssen, um eine bestimmte Aufgabe zu lösen.
Modell
Während des Trainings wird der Algorithmus so lange angepasst, bis er in der Lage ist, korrekte Vorhersagen zu nicht in den Trainingsdaten enthaltenen Daten zu treffen. Ein Modell ist also das Ergebnis des maschinellen Lernens in Form eines parametrierten Algorithmus.
Beispiel für den Zusammenhang zwischen Algorithmus und Modell:
- Szenario: Es liegt eine Vielzahl an Punkten vor, die in einem xy-Koordinatensystem eingetragen sind und welche die Anzahl an verkauften Speiseeisportionen in Abhängigkeit von der Lufttemperatur darstellen.
- Dafür bietet sich ein Regressionsalgorithmus als geeignet an. Daher müssen die Koeffizienten k und d der zugrunde liegenden Regressionsgeraden vom Typ \(y = k \cdot x + d\) ermittelt werden.
- Nun wird der Algorithmus trainiert. Ziel ist, dass die Abweichungsquadrate der beobachteten Werte zur Regressionsgeraden minimiert werden. Während des Trainings werden k=2 und d=0,5 als optimal ermittelt.
- Das lineare Regressionsmodell liegt in Form einer Geradengleichung \(y = 2 \cdot x + 0,5\) vor, wodurch die Beziehung zwischen der Eingangsvariable x (Lufttemperatur) und der Zielvarable (Anzahl an verkauften Speiseeisportionen) beschrieben wird.
Regelbasierte Algorithmen, ohne maschinelles Lernen
Regression
Die Regression ist eine statistische Methode für stetige Daten, die verwendet wird, um aus einer oder mehreren unabhängigen Größen (Xi, Regressor, Ursache) eine abhängige Größe (Y, Regressand, Wirkung) zu berechnen. Die Regression geht dabei über die Korrelation hinaus, weil sie einen Ursache– Wirkungszusammenhang voraussetzt.
Dieser Zusammenhang wird mathematisch als Funktion y=f(x) formuliert und ist im einfachsten Fall – der linearen Regression – eine Regressionsgerade, sonst spricht man von nichtlinearer Regression.
Dazu sollen die Abweichungsquadrate der beobachteten Werte zur Regressionsgeraden (Gerade = linearer Zusammenhang) minimiert werden. Alle Punkte eines Streudiagramms (nicht einzelne ! Punkte) haben den minimalen Abstand zur Regressionsgeraden.
- Die Regression ist besonders hilfreich, wenn man die Beziehung zwischen Variablen verstehen und daraus Vorhersagen treffen möchte. Anwendungsgebiete sind die Modellierung von Klimaveränderungen, Prognose von Aktienkursen, Umsätzen, Krankheitsverläufen oder die Vorhersage von Fehlerraten in der Qualitätskontrolle abhängig von Produktionsfaktoren ..
Beispiel:
Ein Regressionsalgorithmus bestimmt die Koeffizienten k und d der zugrunde liegenden Regressionsgeraden vom Typ \(y = k \cdot x + d\) , für ein linearen Modell aus einer Vielzahl von Punkten, die in einem xy-Koordinatensystem eingetragen sind.
Das lineare Regressionsmodell liegt in Form einer Geradengleichung \(y = 2 \cdot x + 0,5\) vor, welche die Beziehung zwischen der Eingangsvariable (x) und der Zielvariable y beschreibt
Klassifikation
Die Klassifikation ist ein statistisches Verfahren für diskrete Daten, d.h. die Merkmalsausprägung dieser Daten kann nur bestimmte Werte annehmen. In diskreten Modellen ändert sich der Anfangswert um ein bestimmtes Quantum oder ein ganzzahliges Vielfaches davon.
Klassifikation dient dazu, Objekte oder Daten in vordefinierte Kategorien oder Klassen einzuteilen. Das Hauptziel ist es, ein Modell zu erstellen, das automatisch Muster und Unterschiede in den Daten erkennt, um dann neue, noch nicht kategorisierte Daten, in die entsprechenden Klassen zuzuordnen.
Ein Klassifikator ist also ein Algorithmus, um Daten in vordefinierte Kategorien einzuteilen. Dazu wird der Klassifikator auf der Grundlage von Trainingsdaten im überwachten Lernen trainiert, wobei die Trainingsdaten entsprechenden Klassen zugeordnet sind. Während des Trainingsprozesses lernt der Klassifikator, Muster oder Merkmale zu identifizieren, die mit bestimmten Klassen korrelieren.
Trägt man die Merkmalsausprägungen der Daten in ein Koordinatensystem ein, so bilden die Klassen räumlich zusammenhängende Punktwolken. Je schärfer die Klassen getrennt sind, umso größer der Abstand zwischen den, die jeweiligen Klassen repräsentierenden, Punktwolken.
Da wir Menschen lediglich für maximal dreidimensionale räumliche Zusammenhänge noch eine bildliche Vorstellung haben, sind wir auf 3 Merkmalsausprägungen beschränkt. Für die KI sind auch n-dimensionale Punktwolken kein Problem.
Klassifikationsalgorithmen werden häufig für Aufgaben wie Spam-Erkennung, Bilderkennung, medizinische Diagnose, Kunden-Segmentierung und viele andere Anwendungen in der künstlichen Intelligenz eingesetzt.
Beispiel:
E-Mails kann man in die beiden Klassen „Spam“ und Nicht-Spam“ einteilen. Die Aufgabe eines Spamfilters (=Klassifikator) besteht darin, bei jeder neu eingehenden Mail die binäre Entscheidung zu treffen, ob oder ob nicht „Spam“ vorliegt.
Dazu hat der Spamfilter vorab durch überwachtes Lernen gelernt, welche Merkmale Spam E-Mails haben. Das können hohe in Aussicht gestellte Summen oder bestimmte Phrasen im Text oder bestimmte Absender sein.
Clustering
in Ausarbeitung
Zeitreihen
in Ausarbeitung
Regelbasierte Algorithmen, mit Graph-Repräsentation
Die Graphentheorie ist ein Zweig der Mathematik, der die Beziehung zwischen Knoten und Kanten untersucht, wobei den Kanten eine Maßzahl, Gewicht genannt, zugeordnet sein kann.
- Ein Knoten ist dabei ein beliebiger Orientierungspunkt entlang einer Reiseroute.
- Eine Kante ist der Weg oder eine Straße von einem Knoten zum nächsten Knoten
- Das Gewicht einer Kante kann dabei egal sein, oder etwa der Entfernung vom Anfangs- zum Endknoten entsprechen, oder dem Energieverbrauch eines Fahrzeugs, zwischen dem Anfangs- und dem Endknoten entsprechen. Ein negatives Gewicht entsteht etwa bei der Rückspeisung von elektrischer Energie bei einer Bergabfahrt eines Elektrofahrzeugs, oder bei der Bremsung eines U-Bahnzuges.
Bei neuronalen Netzen kommen zu den Knoten, Kanten und Gewichten noch
- Grundtendenz und
- Aktivierungsfunktion
hinzu.
Die Graphentheorie bietet dabei Algorithmen mit verschiedenen Vorzügen und Nachteilen zum Auffinden des optimalen Wegs zwischen 2 gegebenen Orientierungspunkten an.
Beispiele für derartige Algorithmen mit Graph-Repräsentation sind: Breadth First Search Algorithm (BFS), Depth First Search Algorithm (DFS), Dijkstra’s Algorithm, Greedy Best First Search Algorithm, A* Algorithm und der Bellman-Ford Algorithm
Algorithmen für maschinelles Lernen
Es gibt eine Reihe von Algorithmen, die sich beim maschinellen Lernen bewährt haben. Die Auswahl vom Algorithmus hängt von verschiedenen Faktoren, wie der Art der Aufgabenstellung und der Verfügbarkeit von Trainingsdaten ab.
Entscheidungsbäume
Entscheidungsbäume sind Baumlernverfahren, die verwendet werden, um Klassifikations- und Regressionsaufgaben zu lösen. Sie zerlegen ein Problem in eine Baumstruktur von Entscheidungen und Ergebnissen. An jedem Knoten des Baums wird anhand einer bestimmten Funktion oder eines Merkmals eine Entscheidung getroffen, die den Datensatz in Untergruppen aufteilt. Entscheidungsbäume werden häufig in Anwendungen wie Klassifikation und Entscheidungsfindung verwendet. Sie sind intuitiv und leicht verständlich, was sie besonders nützlich für interpretierbare Modelle macht.
Support-Vektor-Maschinen (SVM)
SVM ist eine Methode für überwachtes Lernen, die zur Klassifikation und Regression verwendet wird. Das Ziel ist es, eine Trennfläche zu finden, die die Klassen in den Daten optimal voneinander trennt, wobei der Abstand zwischen den nächstgelegenen Datenpunkten (Support-Vektoren) maximiert wird. SVMs werden häufig in Bereichen wie Bilderkennung, Textklassifikation, Gesichtserkennung und Mustererkennung eingesetzt. Sie eignen sich gut für Probleme, bei denen klare Trennflächen zwischen den Klassen vorhanden sind.
k-nächste Nachbarn (k-NN)
k-NN ist ein einfacher Algorithmus für überwachtes Lernen, der für Klassifikation und Regression verwendet werden kann. Bei k-NN wird ein neuer Datenpunkt basierend auf den k nächstgelegenen Nachbarn in den Trainingsdaten klassifiziert. Die Klassenzugehörigkeit des neuen Punktes wird durch Mehrheitsabstimmung der k nächsten Nachbarn bestimmt. k-NN findet Anwendung in der Mustererkennung, Clustering, Empfehlungssystemen und in der Medizin für die Diagnose und Vorhersage von Krankheiten.
Neuronale Netzwerke
Neuronale Netzwerke werden auf Grund ihrer Bedeutung in einer separaten Miko-Lerneinheit behandelt.
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung mit dem gesparten Geld deinen Erfolg genießen.
Wissenspfad
Aktuelle Lerneinheit
Algorithmen und Modelle im maschinellen Lernen |