Skalen verschiedener Merkmalsausprägungen
Hier findest du folgende Inhalte
Formeln
Datenerhebung für statistische Aussagen
Bei der Datenerhebung für statistische Aussagen hat sich folgende Terminologie etabliert:
statistische Einheit
Eine statistische Einheit, auch Erhebungseinheit genannt, ist ein einzelnes Element der Grundgesamtheit (z.B. Herr Max Mustermann).
Grundgesamtheit G
Die Grundgesamtheit G ist die Menge aller Elemente / aller Erhebungseinheiten, auf die sich eine statistische Auswertung bezieht. (z.B.: Alle Österreicher)
Stichprobe
Die Stichprobe ist eine repräsentative Teilmenge, die der Grundgesamtheit zufällig entnommen wurde. (z.B.: 20 zufällig ausgewählte Österreicher). Sie gilt als repräsentativ, wenn sie die typischen Merkmale der Grundgesamtheit repräsentiert.
Stichprobenumfang n
Der Umfang n der Stichprobe entspricht der Anzahl der erhobenen Einheiten. Der Stichprobenumfang soll so gewählt werden, dass lediglich eine möglichst kleine Teilmenge der Grundgesamtheit zu untersuchen ist, die Aussagen aber dennoch für die Grundgesamtheit repräsentativ sind.
Merkmal X, Y
Ein Merkmal X, Y ist jene Eigenschaft der statistischen Einheit, die untersucht werden soll (z.B.: die Körpergröße, Geschlecht). Bei einer Erhebung entspricht einem Merkmal eine Frage. (z.B.: Wie groß sind Sie?,...) Merkmale nehmen unterschiedliche Merkmalsausprägungen an.
Nominales Merkmal
Ein nominales Merkmal ist ein konkret benennbares qualitatives Merkmal (z.B.: Rindsschnitzel, Schweinsschnitzel, Hühnerschnitzel,...)
Ordinales Merkmal
Ein ordinales Merkmal entspricht einem Rang in einer Ordnung (z.B.: Schulnoten 1 .. 5)
Metrisches Merkmal
Ein metrisches Merkmal ist ein quantitatives Merkmal, von dem es ein Bezugsmaß und Vielfache oder Teiler gibt. (z.B.: die PS-Zahl eines Fahrzeugs: 0,1PS, 1PS, 100PS)
Merkmalsausprägung x1, x2,..., y1, y2,...
Eine Merkmalsausprägung x1, x2, x3 …x1, x2, x3 … ist eine ganz bestimmte Eigenschaft, die eines der Merkmale X, Y annehmen kann. Durch eine Messung wird eine Merkmalsausprägung einem Skalenwert zugeordnet. Die Merkmalsausprägung ist der gemessene Wert vom Merkmal (z.B.: X1=180 cm, Y1=männlich). Bei einer Erhebung entspricht die Merkmalsausprägung einer tatsächlich gegebenen Antwort auf die Frage nach dem Merkmal. (z.B.: Ich bin 1,80 m groß)
Stetiges Merkmal
Ein stetiges Merkmal liegt vor, wenn die Merkmalsausprägung jeden Wert innerhalb eines Intervalls annehmen kann (z.B.: 180,1cm, 180,15cm, 180,157cm,...)
Diskretes Merkmal
Ein diskretes Merkmal liegt vor, wenn die Merkmalsausprägung nur bestimmte Werte annehmen kann (z.B.: männlich, weiblich, divers)
Nullhypothese H0
Eine Hypothese ist eine Aussage über den Zusammenhang von mindestens zwei Merkmalen einer statistischen Beobachtung, die über das aktuelle Wissen hinaus geht und eine Vermutung beinhaltet, die oft nicht direkt belegt werden kann.
Beim Test einer Hypothese stellt man eine Nullhypothese H0 und eine Gegenhypothese H1 dazu auf.
Die Nullhypothese H0, ist eine Annahme in einem Hypothesentest die besagt, dass es keinen signifikanten Zusammenhang zwischen untersuchten Variablen gibt. Sie wird aufgestellt, um zu prüfen, ob es ausreichende Beweise gibt, um sie abzulehnen um dann die Alternativhypothese, die sehr wohl einen signifikanten Zusammenhang zwischen untersuchten Variablen postuliert, zu akzeptieren.
Dann muss ein Signifikanzniveau \(\alpha\) dafür vorgegeben sein, dass man die Nullhypothese irrtümlich verwirft, obwohl sie zutreffen ist. Ein typisches Signifikanzniveau ist 0,05 (5%). Wenn das Ergebnis vom Hypothesentest einen p-Wert kleiner als das Signifikanzniveau ergibt, lehnt man die Nullhypothese ab.
Beim Hypothesentest unterscheidet man:
- Fehler 1. Art: Man verwirft die Nullhypothese irrtümlich, obwohl sie zutrifft und akzeptiert die (falsche) Gegenhypothese. Man schützt sich vor einem Fehler 1. Art, indem man das Signifikanzniveau absenkt.
- Fehler 2. Art: Man hält an der Nullhypothese fest, obwohl sie nicht zutrifft. Man kann die Wahrscheinlichkeit für einen Fehler 2. Art minimieren, indem man eine ausreichend große Stichprobe verwendet.
Kumulative Verteilungsfunktion
Die kumulative Verteilungsfunktion einer binomialverteilten Zufallsvariablen gibt die Wahrscheinlichkeit an, dass die Zufallsvariable X einen Wert kleiner oder gleich einem bestimmten Wert annimmt. Die kumulative Verteilungsfunktion einer binomialverteilten Zufallsvariablen kann verwendet werden, um Wahrscheinlichkeiten von Ereignissen zu bestimmen, wie zum Beispiel die Wahrscheinlichkeit, dass die Anzahl der Erfolge kleiner oder gleich einer bestimmten Zahl ist oder, dass die Anzahl der Erfolge innerhalb eines bestimmten Intervalls liegt. Die Wahrscheinlichkeit für einen Erfolg wird als p bezeichnet und die Anzahl der Versuche als n.
Für die kumulative Verteilungsfunktion einer nach B(n, p) binomialverteilten Zufallsvariablen gilt:
\(F_p^n\left( k \right) = P_p^n\left( {X \le k} \right) = \sum\limits_{i = 0}^k {B\left( {n;p;i} \right) = \sum\limits_{i = 0}^k {\left( {\begin{array}{*{20}{c}} n\\ i \end{array}} \right)} } \cdot {p^i} \cdot {\left( {1 - p} \right)^{n - i}}\)
Die Berechnung ist zeitaufwändig, weshalb man die Wahrscheinlichkeit aus einer Statistiktabelle herausliest oder mittels Software ermittelt.
Schließende Statistik
Die schließende Statistik ermöglicht es von einer (kleinen) Stichprobe auf die (große) Grundgesamtheit G zu schließen.
Beschreibende Statistik
Die beschreibende Statistik beschreibt die Grundgesamtheit einer Vollerhebung durch charakteristische Kennzahlen (Lage- und Streumaße)
Explorative Statistik
Die explorative Statistik beschäftigt sich mit der Analyse großer Datenmengen, wobei vor der Analyse keine Zusammenhänge zwischen den einzelnen Daten bekannt sind.
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung mit dem gesparten Geld deinen Erfolg genießen.

Urliste
Die Urliste beinhaltet die noch ungeordneten Daten, so wie sie bei der Erhebung erfasst wurden.
Geordnete Urliste
Zur Erleichterung der Auswertung werden die Daten der Urliste nach charakteristischen Merkmalen systematisch angeordnet.
Skalen
Skalen stellen die verschiedenen Merkmalsausprägungen vergleichend gegenüber
Nominalskala
Die Nominalskala dient der Klassifizierung qualitativer Merkmale. Die Merkmalsausprägungen sind verschiedenen (beliebigen) Zahlen zugeordnet. Es gibt keine Rangfolge zwischen den Ausprägungen (z.B. Staatsbürgerschaft: 1=Österreich, 2=Deutsch, 3=Schweiz). Es kann eine Aussage über Gleichheit oder Verschiedenheit der Merkmalsausprägung getroffen werden.
Rang- oder Ordinalskala
Die Rang- oder Ordinalskala wird verwendet, wenn eine Rangordnung der Merkmalsausprägungen vorhanden ist. Je höher der Messwert, umso ausgeprägter ist die spezifische Eigenschaft, aber die Abstände zwischen den Messwerten sind nicht aussagekräftig. (z.B. Prestige von Schülern einer Klassengemeinschaft: Schüler A genießt sehr hohes Prestige = 10, Schüler B hat weniger Prestige = 2). Die zugeordnete Zahl bildet nur die Ordnung ab, ist sonst aber willkürlich. Es kann eine Aussage über Gleichheit oder Verschiedenheit und über Größer-Kleiner Beziehung getroffen werden.
Metrische- oder Kardinalskala
Die Metrische- oder Kardinalskala wird verwendet, wenn quantitativ messbare Merkmalsausprägungen vorliegen. Man unterscheidet dabei noch ob die Skala einen natürlichen Nullpunkt besitzt oder nicht sowie ob die Skalen eine natürliche Einheit haben oder nicht. Es ist eine Rangordnung der Messwerte vorhanden und deren Differenzen sind aussagekräftig. (z.B. ist die Differenz zwischen 90 € und 80 € und die Differenz zwischen 50 € und 40 € jeweils 10 €, und diese 10 € entsprechen in beiden Fällen der selben Kaufkraft (z.B. einer Kinokarte). Es kann eine Aussage über Gleichheit oder Verschiedenheit, über Größer-Kleiner Beziehung getroffen werden und es können die Unterschiede quantifiziert werden.