Lektion 9 - Lageparameter
Website: | iLearn - Lernmanagementsystem der Hochschule Deggendorf |
Kurs: | vhb Demo: Statistik I (alt) |
Buch: | Lektion 9 - Lageparameter |
Gedruckt von: | Gast |
Datum: | Freitag, 22. November 2024, 01:11 |
Beschreibung
In dieser Lektion lernen Sie,
- die Regeln für die Durchführung eines Zufallsexperiments,
- Ergebnisse und Ereignisse kennen,
- die grundlegenden Formeln und Rechenregeln für die Wahrscheinlichkeit,
- die bedingte Wahrscheinlichkeit kennen.
9.1 Lernziele
In dieser Lektion lernen Sie,
- welches die wichtigsten Lageparameter sind,
- wie Sie Lageparameter berechnen und interpretieren,
- welche Lageparameter Sie wann verwenden können.
9.2 Arten von Lageparametern
Die Daten einer Häufigkeitsverteilung lassen sich noch stärker komprimieren, wenn man eine einzige Zahl zur Charakterisierung der Beobachtungswerte heranzieht. Ein solcher Lageparameter soll für die Datenreihe möglichst „repräsentativ“ sein und die Lage der Reihe auf der Merkmalsachse festlegen.
Als Lageparameter finden Verwendung
- der Modus oder häufigster Wert,
- der Median oder Zentralwert,
- das arithmetische Mittel,
- das geometrische Mittel.
9.3 Der Modus
Der Modalwert wurde bereits verwendet (siehe Lektionen 7 und 8).
Für den Modus gilt: (Hinweis: Laufindexwert M bezieht sich auf Ausprägung bzw. Klasse des Modalwerts)
nicht-klassierte Verteilung |
|
M = xM |
wobei fM = max(fj) bzw. hM = max(hj) |
klassierte Verteilung |
|
|
wobei und aM,bM= Klassenunter-/ obergrenze der Einfallsklasse M des Modalwerts |
Beispiel: Lebensdauer von Ventilen
|
|
9.4 Der Zentralwert, Median
- Urliste:
Ordnet man die Beobachtungswerte nach der Größe, dann ist der Median derjenige Beobachtungswert, der die geordnete Reihe halbiert.
Im Falle einer ungeraden Anzahl von Beobachtungswerten ist
Da im Fall einer geraden Anzahl n von Beobachtungswerten jeder Wert im Intervall der obigen Definition genügt, bestimmt man die Intervallmitte:
Beispiel
Lebensdauer von Ventilen nach der Größe geordnet
Beobachtung i | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 | 11 | 12 | 13 | 14 | 15 | 16 |
Dauer in Std. xi | 210 | 230 | 240 | 260 | 280 | 330 | 350 | 360 | 370 | 380 | 390 | 400 | 420 | 440 | 460 | 480 |
Welche Lebensdauer wird von 50 Prozent der Ventile erreicht oder unterschritten?
Der Zentralwert liegt zwischen 360 – 370 und beträgt (gemäß der obigen Berechnung) 365.
→ Die Hälfte der beobachteten Ventile hat eine Lebensdauer von 365 Stunden und weniger.
- Häufigkeitsverteilung:
Im Fall einer Häufigkeitsverteilung ist der Zentralwert der Wert, bei dem die absolute kumulierte Häufigkeit den Wert n/2 bzw. die relative kumulierte Häufigkeit von 50 Prozent erreicht oder erstmals überschreitet.
Bei einer klassierten Häufigkeitsverteilung kann der Zentralwert innerhalb der Klasse, in der der Zentralwert liegt, durch lineare Interpolation mit Hilfe der absoluten oder relativen kumulierten Häufigkeiten ermittelt werden. (Der Index Z bezeichnet die Klasse, in der der Zentralwert liegt.)
bzw.
Beispiel
Beispiel: Lebensdauer von Ventilen
[aj; bj[ |
fj |
Fj |
200 - 300 |
5 |
5 |
300 - 400 |
7 |
12 |
400 - 500 |
4 |
16 |
Summe |
16 |
Welche Lebensdauer wird von 50% der Ventile erreicht oder unterschritten?
→ Der Zentralwert liegt in der Klasse 300 – 400
Innerhalb dieser Klasse wird linear interpoliert:
→ Mindestens 50 Prozent der Ventile erreicht eine Lebensdauer von 342,86 Stunden und weniger und mindestens 50 Prozent der Ventile hat eine Lebensdauer von 342,86 Stunden und mehr.
Quantile
Das Prinzip für die Ermittlung des Zentralwerts lässt sich verallgemeinern, wenn man an Stelle der 50 % Grenze andere Prozentsätze verwendet. Allgemein spricht man dann von den Quantilen einer Verteilung. Die allgemeine Definition für die Quantile lautet:
Ein p % Quantil ist dadurch charakterisiert, dass mindestens p % der Beobachtungen einen Wert kleiner gleich und mindestens (1 – p) % einen Wert größer oder gleich dem Wert xp annehmen.
Insbesondere die Quartile mit 25 % bzw. 75 % werden in der Praxis häufig verwendet, ebenso die Dezile, insbesondere das unterste 10 % Dezil und das oberste 90 % Dezil.
So besagt z.B. der oberste 90% Dezilwert, dass z.B. mindestens 90 Prozent der Bevölkerung eine Körpergröße von maximal x90 cm erreicht und mindestens 10% der Bevölkerung eine Körpergröße hat, die gleich oder größer x90 cm ist.
9.5 Das arithmetische Mittel
Das arithmetische Mittel wird unter Verwendung der Urliste bzw. der Häufigkeitsverteilung wie folgt berechnet (siehe ausführlich in Lektionen 6 u. 7)
Beispiel
Lebensdauer von Ventilen
Beobachtung i |
1 |
2 |
3 |
4 |
5 |
6 |
7 |
8 |
9 |
10 |
11 |
12 |
13 |
14 |
15 |
16 |
Summe |
Dauer in Std. xi |
280 |
330 |
260 |
440 |
420 |
240 |
480 |
360 |
460 |
400 |
230 |
210 |
350 |
370 |
380 |
390 |
5600 |
Wie hoch ist die durchschnittliche Lebensdauer?
→ Das arithmetische Mittel beträgt 350.
→ Die beobachteten Ventile hatten im Durchschnitt eine Lebensdauer von 350 Stunden.
Bei klassierten Daten ist der exakte Wert von nicht zu ermitteln; man berechnet ersatzweise das gewogene arithmetische Mittel aus Klassenmitten mit den Klassenhäufigkeiten als Gewichte (siehe Lektion 7).
Beispiel
Lebensdauer von Ventilen
[aj; bj[ |
fj |
mj |
fjmj |
200 - 300 |
5 |
250 |
1250 |
300 - 400 |
7 |
350 |
2450 |
400 - 500 |
4 |
450 |
1800 |
Summe |
16 |
5500 |
Wie hoch ist die durchschnittliche Lebensdauer?
→ Das aus Klassenmitten errechnete arithmetische Mittel beträgt 343,75.
→ Die Ventile hatten im Durchschnitt eine Lebensdauer von näherungsweise 343,75 Stunden.
9.6 Das geometrische Mittel
Bestehen die Merkmalswerte aus Wachstumsfaktoren oder Zinsfaktoren, die über eine Folge von Perioden hinweg beobachtet werden, ist an Stelle des arithmetischen das geometrische Mittel zu verwenden. Es ist definiert als:
Die gebräuchlichsten Anwendungen des geometrischen Mittels finden sich in der Berechnung der durchschnittlichen Wachstumsrate bzw. der Durchschnittsverzinsung.
Beispiel
Ein Bundesschatzbrief mit einer Laufzeit von sieben Jahren werde beginnend mit dem ersten Jahr zu folgenden Zinssätzen verzinst:
Zins rt : |
2,5% |
3,0% |
3,5% |
4,25% |
4,5% |
5,0% |
5,0% |
Wie hoch ist die Durchschnittsverzinsung?
Zunächst müssen die Zinssätze rt über die Beziehungen rt = (qt – 1)*100 in Zinsfaktoren umgerechnet werden:
Zinsfaktor qt : |
1,025 |
1,03 |
1,035 |
1,0425 |
1,045 |
1,05 |
1,05 |
Dann ergibt sich für das geometrische Mittel:
Mit dem Bundesschatzbrief erzielt der Anleger eine durchschnittliche Verzinsung von 3,96% [= (1,0396 - 1)*100] pro Jahr.
Das geometrische Mittel hat die Eigenschaft, über n Perioden hinweg denselben Effekt zu erzielen wie die sukzessive Multiplikation der n Werte .
9.7 Vergleich und Verwendung der Lageparameter
Je nach Merkmalsart bzw. Skalenniveau eines Merkmals können folgende Lageparameter verwendet werden.
Skalierung | nominal | ordinal | metrisch |
Modus | ja Beispiel | ja Beispiel | ja Beispiel |
Median | nein | ja Beispiel | ja Beispiel |
arithmetisches Mittel | nein | nein | ja1) Beispiel |
Anwendungsbeispiele | |||
Skalierung | nominal | ordinal | metrisch |
Modus | |||
Median | nein | ||
Arithmetisches Mittel | nein | nein2) |
Anmerkungen:
1) Ausnahme: Bei Wachstumsfaktoren wird das geometrische Mittel verwendet.
2) Es ist gebräuchlich, Notendurchschnitte zu errechnen. Hier behandelt man die Note wie ein metrisch verschlüsseltes Merkmal. Dies ist nicht unproblematisch, wenn man alternativ die Handelsklasse bei Agrarprodukten betrachtet. Die Handelsklasse als ordinal skaliertes Merkmal setzt sich aus einer Summe von quantitativen und qualitativen Eigenschaften/Standards eines Produkts zusammen. Die durchschnittliche Handelsklasse eines Erntejahres zu berechnen, ist somit Nonsens.
9.8 Statistische Berechnung und Interpretation
Sie haben im Internet eine Liste von 25 Tankstellen in ihrer Umgebung mit den Preisen in Euro-Cent für Benzin gefunden.
143,9 | 143,9 | 144,4 | 144,4 | 145,9 | 145,9 | 145,9 | 145,9 | 145,9 | 146,9 | 146,9 | 146,9 | |
146,9 | 146,9 | 147,9 | 147,9 | 147,9 | 147,9 | 148,4 | 148,4 | 148,9 | 148,9 | 148,9 | 149,9 | 149,9 |
Bitte beantworten Sie selbstständig die folgenden Fragen:
Welcher Benzinpreis kommt am häufigsten vor? |
|
Welcher Benzinpreis wird von der Hälfte der Tankstellen erreicht oder unterschritten? |
|
Welchen Benzinpreis verlangen die Tankstellen im Durchschnitt? |
|
Welcher Benzinpreis wird von 3/4 aller Tankstellen erreicht oder unterschritten? |
Erstellen Sie aus diesen Messergebnissen ausgehend von 142 Cent und einer Klassenbreite von 2 Cent eine Häufigkeitsverteilung und bestimmen Sie die Lageparameter anhand dieser Häufigkeitsverteilung.
Welche Lageparameter ergeben sich aufgrund der Häufigkeitsverteilung? |
9.9 Terminologie
- der Modus, Modalwert oder häufigste Wert?
- der Modalwert einer klassierten Häufigkeitsverteilung?
- die Vorgehensweise bei der Berechnung des arithmetischen Mittels?
- der Median oder Zentralwert?
- das geometrische Mittel?
Mauszeiger auf die Frage: Die Antwort erscheint.
9.10 Übungen - interaktiv
Hier können Sie folgende Übungen herunterladen.
9.11 Lernvideo
Hier können Sie folgende Lernvideos sehen:
- Video - Lageparameter - Säulendiagramm