Lektion 9 - Lageparameter

Website: iLearn - Lernmanagementsystem der Hochschule Deggendorf
Kurs: vhb Demo: Statistik I
Buch: Lektion 9 - Lageparameter
Gedruckt von: Gast
Datum: Montag, 3. Oktober 2022, 07:09

Beschreibung

In dieser Lektion lernen Sie,

  • die Regeln für die Durchführung eines Zufallsexperiments,
  • Ergebnisse und Ereignisse kennen,
  • die grundlegenden Formeln und Rechenregeln für die Wahrscheinlichkeit,
  • die bedingte Wahrscheinlichkeit kennen.

9.1 Lernziele

In dieser Lektion lernen Sie,

  • welches die wichtigsten Lageparameter sind,

  • wie Sie Lageparameter berechnen und interpretieren,

  • welche Lageparameter Sie wann verwenden können.

9.2 Arten von Lageparametern

Die Daten einer Häufigkeitsverteilung lassen sich noch stärker komprimieren, wenn man eine einzige Zahl zur Charakterisierung der Beobachtungswerte heranzieht. Ein solcher Lageparameter soll für die Datenreihe möglichst „repräsentativ“ sein und die Lage der Reihe auf der Merkmalsachse festlegen.

Als Lageparameter finden Verwendung

  • der Modus oder häufigster Wert,

  • der Median oder Zentralwert,

  • das arithmetische Mittel,

  • das geometrische Mittel.

9.3 Der Modus

Der Modalwert wurde bereits verwendet (siehe Lektionen 7 und 8).

Für den Modus gilt: (Hinweis: Laufindexwert M bezieht sich auf Ausprägung bzw. Klasse des Modalwerts)

nicht-klassierte Verteilung

 M = xM 

wobei fM = max(fj) bzw. hM = max(hj)

klassierte Verteilung

                                                 

                                              

wobei

und    aM,bM= Klassenunter-/

                       obergrenze der

                       Einfallsklasse M des

                       Modalwerts

Beispiel: Lebensdauer von Ventilen

[aj ,bj[ fj
200 - 300 5
300 - 400 7
400 - 500 4
Summe 16
Welche Lebensdauer kommt am häufigsten vor?
Die Modalklasse ist 300 – 400.
Der Modalwert ist 350.
Am häufigsten kommt eine Lebensdauer von 350 Std. vor.

9.4 Der Zentralwert, Median



  • Urliste

Ordnet man die Beobachtungswerte nach der Größe, dann ist der Median derjenige Beobachtungswert, der die geordnete Reihe halbiert.

Im Falle einer ungeraden Anzahl von Beobachtungswerten ist

Formel_Zentralwert1

Da im Fall einer geraden Anzahl n von Beobachtungswerten jeder Wert im Intervall der obigen Definition genügt, bestimmt man die Intervallmitte:

Zentralwert3

Beispiel

Lebensdauer von Ventilen nach der Größe geordnet

Beobachtung i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Dauer in Std. xi 210 230 240 260 280 330 350 360 370 380 390 400 420 440 460 480

Welche Lebensdauer wird von 50 Prozent der Ventile erreicht oder unterschritten?

Der Zentralwert liegt zwischen 360 – 370 und beträgt (gemäß der obigen Berechnung) 365.

→ Die Hälfte der beobachteten Ventile hat eine Lebensdauer von 365 Stunden und weniger.



  • Häufigkeitsverteilung:

Im Fall einer Häufigkeitsverteilung ist der Zentralwert der Wert, bei dem die absolute kumulierte Häufigkeit den Wert n/2 bzw. die relative kumulierte Häufigkeit von 50 Prozent erreicht oder erstmals überschreitet.

Bei einer klassierten Häufigkeitsverteilung kann der Zentralwert innerhalb der Klasse, in der der Zentralwert liegt, durch lineare Interpolation mit Hilfe der absoluten oder relativen kumulierten Häufigkeiten ermittelt werden. (Der Index Z bezeichnet die Klasse, in der der Zentralwert liegt.)

 Zentralwert4      bzw.    Zentralwert6

Beispiel

Beispiel: Lebensdauer von Ventilen

[aj; bj[

fj

Fj

200 - 300

5

5

300 - 400

7

12

400 - 500

4

16

Summe

16

Welche Lebensdauer wird von 50% der Ventile erreicht oder unterschritten?

→ Der Zentralwert liegt in der Klasse  300 – 400

Innerhalb dieser Klasse wird linear interpoliert:

L9 Zentralwert 7 Interpolation

→ Mindestens 50 Prozent der Ventile erreicht eine Lebensdauer von 342,86 Stunden und weniger und mindestens 50 Prozent der Ventile hat eine Lebensdauer von 342,86 Stunden und mehr.

Quantile

Das Prinzip für die Ermittlung des Zentralwerts lässt sich verallgemeinern, wenn man an Stelle der 50 % Grenze andere Prozentsätze verwendet. Allgemein spricht man dann von den Quantilen einer Verteilung. Die allgemeine Definition für die Quantile lautet:

Ein p % Quantil ist dadurch charakterisiert, dass mindestens p % der Beobachtungen einen Wert kleiner gleich und mindestens (1 – p) % einen Wert größer oder gleich dem Wert xp annehmen.

Insbesondere die Quartile mit 25 % bzw. 75 % werden in der Praxis häufig verwendet, ebenso die Dezile, insbesondere das unterste 10 % Dezil und das oberste 90 % Dezil.

So besagt z.B. der oberste 90% Dezilwert, dass z.B. mindestens 90 Prozent der Bevölkerung eine Körpergröße von maximal x90 cm erreicht und mindestens 10% der Bevölkerung eine Körpergröße hat, die gleich oder größer x90 cm ist.

9.5 Das arithmetische Mittel

Das arithmetische Mittel wird unter Verwendung der Urliste bzw. der Häufigkeitsverteilung wie folgt berechnet (siehe ausführlich in Lektionen 6 u. 7)

  bzw.     bzw.  

Beispiel

Lebensdauer von Ventilen

Beobachtung
i

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

Summe
Dauer in Std.
xi

280

330

260

440

420

240

480

360

460

400

230

210

350

370

380

390

5600

Wie hoch ist die durchschnittliche Lebensdauer?

→ Das arithmetische Mittel beträgt 350.

→ Die beobachteten Ventile hatten im Durchschnitt eine Lebensdauer von 350 Stunden.

Bei klassierten Daten ist der exakte Wert von  nicht zu ermitteln; man berechnet ersatzweise das gewogene arithmetische Mittel aus Klassenmitten mit den Klassenhäufigkeiten als Gewichte (siehe Lektion 7).

 

Beispiel

Lebensdauer von Ventilen

[aj; bj[

fj

mj

fjmj

200 - 300

  5

250

1250

300 - 400

  7

350

2450

400 - 500

  4

450

1800

Summe

16

5500

Wie hoch ist die durchschnittliche Lebensdauer?

→ Das aus Klassenmitten errechnete arithmetische Mittel beträgt 343,75.

→ Die Ventile hatten im Durchschnitt eine Lebensdauer von näherungsweise 343,75 Stunden.

9.6 Das geometrische Mittel

Bestehen die Merkmalswerte aus Wachstumsfaktoren oder Zinsfaktoren, die über eine Folge von Perioden hinweg beobachtet werden, ist an Stelle des arithmetischen das geometrische Mittel zu verwenden. Es ist definiert als:

Die gebräuchlichsten Anwendungen des geometrischen Mittels finden sich in der Berechnung der durchschnittlichen Wachstumsrate bzw. der Durchschnittsverzinsung.

 Beispiel

Ein Bundesschatzbrief mit einer Laufzeit von sieben Jahren werde beginnend mit dem ersten Jahr zu folgenden Zinssätzen verzinst:

Zins rt :

2,5%

3,0%

3,5%

4,25%

4,5%

5,0%

5,0%

Wie hoch ist die Durchschnittsverzinsung?

Zunächst müssen die Zinssätze rt über die Beziehungen rt = (qt – 1)*100 in Zinsfaktoren umgerechnet werden:

Zinsfaktor qt :

1,025

1,03

1,035

1,0425

1,045

1,05

1,05

Dann ergibt sich für das geometrische Mittel:

I_9_6_geometrisches_Mittel_Bsp

Mit dem Bundesschatzbrief erzielt der Anleger eine durchschnittliche Verzinsung von 3,96% [= (1,0396 - 1)*100] pro Jahr.

Das geometrische Mittel hat die Eigenschaft, über n Perioden hinweg denselben Effekt zu erzielen wie die sukzessive Multiplikation der n Werte .

9.7 Vergleich und Verwendung der Lageparameter

Je nach Merkmalsart bzw. Skalenniveau eines Merkmals können folgende Lageparameter verwendet werden.

Skalierung nominal ordinal metrisch
Modus ja Beispiel ja Beispiel ja Beispiel
Median nein ja Beispiel ja Beispiel
arithmetisches Mittel nein nein ja1) Beispiel
Anwendungsbeispiele
Skalierung nominal ordinal metrisch
Modus      
Median nein    
Arithmetisches Mittel nein nein2)  

Anmerkungen:

1) Ausnahme: Bei Wachstumsfaktoren wird das geometrische Mittel verwendet.

2) Es ist gebräuchlich, Notendurchschnitte zu errechnen. Hier behandelt man die Note wie ein metrisch verschlüsseltes Merkmal. Dies ist nicht unproblematisch, wenn man alternativ die Handelsklasse bei Agrarprodukten betrachtet. Die Handelsklasse als ordinal skaliertes Merkmal setzt sich aus einer Summe von quantitativen und qualitativen Eigenschaften/Standards eines Produkts zusammen. Die durchschnittliche Handelsklasse eines Erntejahres zu berechnen, ist somit Nonsens.


9.8 Statistische Berechnung und Interpretation

Sie haben im Internet eine Liste von 25 Tankstellen in ihrer Umgebung mit den Preisen in Euro-Cent für Benzin gefunden.

143,9 143,9 144,4 144,4 145,9 145,9 145,9 145,9 145,9 146,9 146,9 146,9
146,9 146,9 147,9 147,9 147,9 147,9 148,4 148,4 148,9 148,9 148,9 149,9 149,9

Bitte beantworten Sie selbstständig die folgenden Fragen:

Welcher Benzinpreis kommt am häufigsten vor?

Antwort

Welcher Benzinpreis wird von der Hälfte der Tankstellen erreicht oder unterschritten?

Antwort

Berechnung

Welchen Benzinpreis verlangen die Tankstellen im Durchschnitt?

Antwort

Berechnung

Welcher Benzinpreis wird von 3/4 aller Tankstellen erreicht oder unterschritten?

Antwort

Berechnung

Erstellen Sie aus diesen Messergebnissen ausgehend von 142 Cent und einer Klassenbreite von 2 Cent eine Häufigkeitsverteilung und bestimmen Sie die Lageparameter anhand dieser Häufigkeitsverteilung.

Welche Lageparameter ergeben sich aufgrund der Häufigkeitsverteilung?

Antwort

Berechnung

9.9 Terminologie

       Was ist ...

Mauszeiger auf die Frage: Die Antwort erscheint.

9.10 Übungen - interaktiv

Hier können Sie folgende Übungen herunterladen.

9.11 Lernvideo

Hier können Sie folgende Lernvideos sehen:

  • Video - Lageparameter - Säulendiagramm