Grundgesamtheit G
Hier findest du folgende Inhalte
Formeln
Datenerhebung für statistische Aussagen
Bei der Datenerhebung für statistische Aussagen hat sich folgende Terminologie etabliert:
statistische Einheit
Eine statistische Einheit, auch Erhebungseinheit genannt, ist ein einzelnes Element der Grundgesamtheit (z.B. Herr Max Mustermann).
Grundgesamtheit G
Die Grundgesamtheit G ist die Menge aller Elemente / aller Erhebungseinheiten, auf die sich eine statistische Auswertung bezieht. (z.B.: Alle Österreicher)
Stichprobe
Die Stichprobe ist eine repräsentative Teilmenge, die der Grundgesamtheit zufällig entnommen wurde. (z.B.: 20 zufällig ausgewählte Österreicher). Sie gilt als repräsentativ, wenn sie die typischen Merkmale der Grundgesamtheit repräsentiert.
Stichprobenumfang n
Der Umfang n der Stichprobe entspricht der Anzahl der erhobenen Einheiten. Der Stichprobenumfang soll so gewählt werden, dass lediglich eine möglichst kleine Teilmenge der Grundgesamtheit zu untersuchen ist, die Aussagen aber dennoch für die Grundgesamtheit repräsentativ sind.
Merkmal X, Y
Ein Merkmal X, Y ist jene Eigenschaft der statistischen Einheit, die untersucht werden soll (z.B.: die Körpergröße, Geschlecht). Bei einer Erhebung entspricht einem Merkmal eine Frage. (z.B.: Wie groß sind Sie?,...) Merkmale nehmen unterschiedliche Merkmalsausprägungen an.
Nominales Merkmal
Ein nominales Merkmal ist ein konkret benennbares qualitatives Merkmal (z.B.: Rindsschnitzel, Schweinsschnitzel, Hühnerschnitzel,...)
Ordinales Merkmal
Ein ordinales Merkmal entspricht einem Rang in einer Ordnung (z.B.: Schulnoten 1 .. 5)
Metrisches Merkmal
Ein metrisches Merkmal ist ein quantitatives Merkmal, von dem es ein Bezugsmaß und Vielfache oder Teiler gibt. (z.B.: die PS-Zahl eines Fahrzeugs: 0,1PS, 1PS, 100PS)
Merkmalsausprägung x1, x2,..., y1, y2,...
Eine Merkmalsausprägung x1, x2, x3 …x1, x2, x3 … ist eine ganz bestimmte Eigenschaft, die eines der Merkmale X, Y annehmen kann. Durch eine Messung wird eine Merkmalsausprägung einem Skalenwert zugeordnet. Die Merkmalsausprägung ist der gemessene Wert vom Merkmal (z.B.: X1=180 cm, Y1=männlich). Bei einer Erhebung entspricht die Merkmalsausprägung einer tatsächlich gegebenen Antwort auf die Frage nach dem Merkmal. (z.B.: Ich bin 1,80 m groß)
Stetiges Merkmal
Ein stetiges Merkmal liegt vor, wenn die Merkmalsausprägung jeden Wert innerhalb eines Intervalls annehmen kann (z.B.: 180,1cm, 180,15cm, 180,157cm,...)
Diskretes Merkmal
Ein diskretes Merkmal liegt vor, wenn die Merkmalsausprägung nur bestimmte Werte annehmen kann (z.B.: männlich, weiblich, divers)
Nullhypothese H0
Eine Hypothese ist eine Aussage über den Zusammenhang von mindestens zwei Merkmalen einer statistischen Beobachtung, die über das aktuelle Wissen hinaus geht und eine Vermutung beinhaltet, die oft nicht direkt belegt werden kann.
Beim Test einer Hypothese stellt man eine Nullhypothese H0 und eine Gegenhypothese H1 dazu auf.
Die Nullhypothese H0, ist eine Annahme in einem Hypothesentest die besagt, dass es keinen signifikanten Zusammenhang zwischen untersuchten Variablen gibt. Sie wird aufgestellt, um zu prüfen, ob es ausreichende Beweise gibt, um sie abzulehnen um dann die Alternativhypothese, die sehr wohl einen signifikanten Zusammenhang zwischen untersuchten Variablen postuliert, zu akzeptieren.
Dann muss ein Signifikanzniveau \(\alpha\) dafür vorgegeben sein, dass man die Nullhypothese irrtümlich verwirft, obwohl sie zutreffen ist. Ein typisches Signifikanzniveau ist 0,05 (5%). Wenn das Ergebnis vom Hypothesentest einen p-Wert kleiner als das Signifikanzniveau ergibt, lehnt man die Nullhypothese ab.
Beim Hypothesentest unterscheidet man:
- Fehler 1. Art: Man verwirft die Nullhypothese irrtümlich, obwohl sie zutrifft und akzeptiert die (falsche) Gegenhypothese. Man schützt sich vor einem Fehler 1. Art, indem man das Signifikanzniveau absenkt.
- Fehler 2. Art: Man hält an der Nullhypothese fest, obwohl sie nicht zutrifft. Man kann die Wahrscheinlichkeit für einen Fehler 2. Art minimieren, indem man eine ausreichend große Stichprobe verwendet.
Kumulative Verteilungsfunktion
Die kumulative Verteilungsfunktion einer binomialverteilten Zufallsvariablen gibt die Wahrscheinlichkeit an, dass die Zufallsvariable X einen Wert kleiner oder gleich einem bestimmten Wert annimmt. Die kumulative Verteilungsfunktion einer binomialverteilten Zufallsvariablen kann verwendet werden, um Wahrscheinlichkeiten von Ereignissen zu bestimmen, wie zum Beispiel die Wahrscheinlichkeit, dass die Anzahl der Erfolge kleiner oder gleich einer bestimmten Zahl ist oder, dass die Anzahl der Erfolge innerhalb eines bestimmten Intervalls liegt. Die Wahrscheinlichkeit für einen Erfolg wird als p bezeichnet und die Anzahl der Versuche als n.
Für die kumulative Verteilungsfunktion einer nach B(n, p) binomialverteilten Zufallsvariablen gilt:
\(F_p^n\left( k \right) = P_p^n\left( {X \le k} \right) = \sum\limits_{i = 0}^k {B\left( {n;p;i} \right) = \sum\limits_{i = 0}^k {\left( {\begin{array}{*{20}{c}} n\\ i \end{array}} \right)} } \cdot {p^i} \cdot {\left( {1 - p} \right)^{n - i}}\)
Die Berechnung ist zeitaufwändig, weshalb man die Wahrscheinlichkeit aus einer Statistiktabelle herausliest oder mittels Software ermittelt.
Schließende Statistik
Die schließende Statistik ermöglicht es von einer (kleinen) Stichprobe auf die (große) Grundgesamtheit G zu schließen.
Beschreibende Statistik
Die beschreibende Statistik beschreibt die Grundgesamtheit einer Vollerhebung durch charakteristische Kennzahlen (Lage- und Streumaße)
Explorative Statistik
Die explorative Statistik beschäftigt sich mit der Analyse großer Datenmengen, wobei vor der Analyse keine Zusammenhänge zwischen den einzelnen Daten bekannt sind.
Schon den nächsten Urlaub geplant?
Auf maths2mind kostenlos auf Prüfungen vorbereiten!
Nach der Prüfung mit dem gesparten Geld deinen Erfolg genießen.