9.4 Zentralwert (Median) und Quantile


(1) Zentralwert

  • Urliste 

Ordnet man die Beobachtungswerte nach der Größe, dann ist der Median derjenige Beobachtungswert, der die geordnete Reihe halbiert.

Im Falle einer ungeraden Anzahl von Beobachtungswerten ist

 \mathsf{\Large{x_z = x_{\LARGE {\frac{n+1}{2}}}}}

Im Fall einer geraden Anzahl n von Beobachtungswerten genügt jeder Wert im Intervall   \mathsf{\Large{ \left[x_{\LARGE{\frac{n}{2}}} ; x_{\LARGE{\frac{n}{2}} \Large {+1}}\right]}}

der obigen Definition. Man bestimmt der Einfachheit halber die Intervallmitte als Näherungswert des Zentralwerts

 \mathsf{\Large{x_z = \frac{1}{2} \left[x_{\LARGE {\frac{n}{2}}} + x_{\LARGE{\frac{n}{2}} \Large {+1}}\right]}}


Beispiel: Lebensdauer von Ventilen nach der Größe geordnet

Beobachtung i 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16
Dauer in Std. xi 210 230 240 260 280 330 350 360 370 380 390 400 420 440 460 480

Welche Lebensdauer wird von 50 Prozent der Ventile erreicht oder unterschritten?

 \mathsf{\Large{x_z = \frac{1}{2}\left[\normalsize{360+370}\right] = \normalsize{365}}}


Der Zentralwert liegt zwischen 360 und 370 und beträgt (gemäß der obigen Näherungsformel) 365.

→ Die Hälfte der beobachteten Ventile hat eine Lebensdauer von 365 Stunden und weniger.


  • Häufigkeitsverteilung:

Im Fall einer Häufigkeitsverteilung ist der Zentralwert der Wert, bei dem die absolute kumulierte Häufigkeit den Wert n/2 bzw. die relative kumulierte Häufigkeit den Wert von 0,5 bzw. 50 Prozent erreicht oder erstmals überschreitet.

Bei einer klassierten Häufigkeitsverteilung kann der Zentralwert innerhalb der Klasse, in der der Zentralwert liegt, durch lineare Interpolation mit Hilfe der absoluten oder relativen kumulierten Häufigkeiten ermittelt werden. (Der Index Z bezeichnet die Klasse, in der der Zentralwert liegt.)

 \mathsf{\large{x_z = a_z + \left(\Large{\frac{n}{2}} - \normalsize {F_{Z-1}}\right)} \cdot \Large{\frac{b_z - a_z}{F_Z - F_{Z-1}}}}     bzw.     \mathsf{\large{x_z} = \normalsize {a_z + \left(0,5 - H_{Z-1}\right)} \cdot
            \Large{\frac{b_z - a_z}{H_Z - H_{Z-1}}}}     


Beispiel: Lebensdauer von Ventilen

[aj; bj[

fj

Fj

200 - 300

5

5

300 - 400

7

12

400 - 500

4

16

Summe

16

Welche Lebensdauer wird von 50% der Ventile erreicht oder unterschritten?

→ Der Zentralwert liegt in der Klasse  300 – 400

Innerhalb dieser Klasse wird linear interpoliert:

 \mathsf{\large{x_z = \normalsize {300 + (8 - 5)} \cdot \Large {\frac{400 - 300}{12 - 5}} = \normalsize {342,86}}}

→ Mindestens 50 Prozent der Ventile erreicht eine Lebensdauer von 342,86 Stunden und weniger und mindestens 50 Prozent der Ventile hat eine Lebensdauer von 342,86 Stunden und mehr.


(2) Quantile

Das Prinzip für die Ermittlung des Zentralwerts lässt sich verallgemeinern, wenn man an Stelle der 50 % Grenze andere Prozentsätze verwendet. Allgemein spricht man dann von den Quantilen einer Verteilung. Die allgemeine Definition für die Quantile lautet:

Ein p % Quantil ist dadurch charakterisiert, dass mindestens p % der Beobachtungen einen Wert kleiner gleich und mindestens (1 – p) % einen Wert größer oder gleich dem Wert xp annehmen.

Insbesondere die Quartile mit 25 % bzw. 75 % werden in der Praxis häufig verwendet, ebenso die Dezile, insbesondere das unterste 10 % Dezil und das oberste 90 % Dezil.

So besagt z.B. der oberste 90% Dezilwert, dass z.B. mindestens 90 Prozent der Bevölkerung eine Körpergröße von maximal x90 cm erreicht und mindestens 10% der Bevölkerung eine Körpergröße hat, die gleich oder größer x90 cm ist.



vhb Logo

Glossar