Glossar zur deskriptiven Statistik
Vorbemerkung
Dieses Glossar ist der Versuch, den Studierenden ausgewählte Grundbegriffe eines Teiles der Statistischen Methodenlehre, der Deskriptiven Statistik, wie sie im Grundstudium der Wirtschaftswissenschaften an der Wirtschafts- und Sozialwissenschaftlichen Fakultät der Universität zu Köln gelehrt wird, in verbalisierter Form zugänglich zu machen. Es kommt damit einem Wunsch nach, diesen Teil des statistischen Grundstudiums - ebenso wie Wahrscheinlichkeitsrechnung und Statistische Inferenz - in einer formelfreien Darstellung zum Nachschlagen zu präsentieren. Die Beschränkung auf das Grundstudium schränkt auch den inhaltlichen Teil stark ein. Das Glossar vermeidet die Verwendung von Formeln, diese bleiben den üblichen Fachbüchern bzw. Formelsammlungen vorbehalten. Die Verbalisierung statistischer Formeln und Begriffe verlangt auch vom Autor eine besondere und ungewohnte Beschäftigung mit dem Fachgebiet. Die Darstellung kann den Studierenden zum Wiederholen und damit zum Nachschlagen ausgewählter Begriffe dienen, ohne dass dies zwangsläufig über den Formelapparat geschehen muß.
Die formelfreie Erläuterung beinhaltet teilweise eine gewisse Unschärfe in den Begriffen, diese wurde bewusst in Kauf genommen. Dennoch sind aus dem Zusammenhang genommen einige Erläuterungen ohne ergänzende Formel sicher nicht leicht verständlich. Dies hat seinen Grund mit darin, dass bei der Verbalisierung die methodische Korrektheit weitgehend erhalten bleiben sollte.
Die Benutzung der lexikographischen Darstellung soll durch einige Hinweise erleichtert werden. Aus Adjektiv und Substantiv bestehende Begriffe sind in der Regel unter dem Substantiv eingeordnet. Ein Link bzw. ein durch "siehe" ergänzter Link verweist auf eine an anderer Stelle definierte Größe, falls diese nicht unter demselben Oberbegriff wie die Ausgangsgröße steht. Soweit für eine Größe verschiedene Begriffe synonym benutzt werden, wird durch "Syn." bzw. "Syn. für" darauf verwiesen. Eine ausführliche Darstellung des Stoffes enthält der Studientext E. Bomsdorf: Deskriptive Statistik, 14., durchgesehene Auflage, Lohmar - Köln 2013.
Die Datei lässt sich ausdrucken, sie kann ebenfalls als html-Datei abgespeichert werden und dann sowohl interaktiv zum Nachschlagen als auch zum Wiederholen der Begriffe Verwendung finden. Jegliche Nutzung ist nur zum privaten Gebrauch gestattet.
Glossar
A-Z
A B D E F G H I K L M N O P Q R S T U V W Z
A
B
D
DISPARITÄTSKOEFFIZIENT VON GINI
DURCHSCHNITTLICHE ABSOLUTE ABWEICHUNG
DURCHSCHNITTLICHE QUADRATISCHE ABWEICHUNG
E
EMPIRISCHE VERTEILUNGSFUNKTION
F
G
H
I
K
KONTINGENZKOEFFIZIENT VON PEARSON
KONZENTRATIONSINDEX VON ROSENBLUTH
KONZENTRATIONSKOEFFIZIENT VON ROSENBLUTH
KORRELATIONSKOEFFIZIENT VON BRAVAIS-PEARSON
L
M
METHODE DER KLEINSTEN QUADRATE
N
O
P
Q
R
RANGKORRELATIONSKOEFFIZIENT VON SPEARMAN
S
SCHWERPUNKT EINER ZWEIDIMENSIONALEN VERTEILUNG
T
U
V
W
Z
A
Bestimmt dadurch, dass Rangfolge, Abstand und Verhältnis zwischen Merkmalswerten definiert sind und neben einem natürlichen Nullpunkt eine natürliche Einheit existiert; invariant gegenüber identischen Transformationen der Merkmalswerte. Siehe metrisches Merkmal.
- ~ für arithmetische Mittelwerte:
Formel zur Berechnung des arithmetischen Mittels einer aus mehreren Teilgesamtheiten bestehenden Gesamtheit, sofern für diese Teilgesamtheiten die Umfänge und die arithmetischen Mittelwerte bekannt sind.
- ~ für Varianzen:
Formel zur Berechnung der Varianz einer aus mehreren Teilgesamtheiten bestehenden Gesamtheit, sofern für diese Teilgesamtheiten die Umfänge, die Varianzen und die arithmetischen Mittelwerte bekannt sind. Syn.: Varianzzerlegungssatz.
Siehe additive Zerlegung einer Zeitreihe.
Syn. für Zusammenhangsmaße.
Meist Syn. für Grundgesamtheit, mitunter auch Teilmenge der Grundgesamtheit, über die Informationen beschafft werden sollen.
B
Syn. für (konstante) Bezugszeit einer Folge von Messzahlen bzw. von Indexzahlen.
Bei Messzahlen Zeitpunkt bzw. Zeitraum, dessen aktueller Wert für ein interessierendes Merkmal auf den Wert dieses Merkmals in der Basiszeit bezogen wird (analog bei Indexzahlen). Syn.: Referenzzeit.
Zeitpunktbezogene Größe. Gegensatz: Bewegungsgröße.
Zeitpunktbezogene Masse. Gegensatz: Bewegungsmasse.
Auf das Intervall von 0 bis 1 beschränktes Maß für den Erklärungsgehalt einer Regression. Bei der Regression 2. Art wird das verwendete Maß auch als Determinationskoeffizient bezeichnet.
Zeitraumbezogene Größe. Gegensatz: Bestandsgröße.
- kurzfristige ~: Meist Syn. für Saisonkomponente.
Zeitraumbezogene Masse. Gegensatz: Bestandsmasse.
Quotient von zwei sachlich verschiedenen, in sinnvoller Beziehung zueinander
stehenden Kenngrößen für dieselbe
Menge von Einheiten.
- Mittelwert von ~en:
Bei der Bildung von Mittelwerten von Beziehungszahlen finden in Abhängigkeit von den verwendeten Gewichten das arithmetische oder das harmonische Mittel Verwendung.
Nennergröße des Quotienten aus dem sich die Messzahl bestimmt.
Bei Messzahlen Zeitpunkt bzw. Zeitraum, mit deren Wert für ein interessierendes Merkmal der aktuelle Wert dieses Merkmals verglichen wird. Der Begriff der Bezugszeit wird auf Indexzahlen übertragen, soweit diese sich als Mittelwert von Messzahlen mit derselben Bezugszeit ergeben. Syn.: Basiszeit. Mitunter wird der Begriff Basiszeit auf den Fall einer konstanten Bezugszeit beschränkt.
Weisen bei einer Erhebung zwei oder mehr Einheiten denselben Wert bzgl. des mindestens ordinal skalierten Merkmals auf, so wird bzgl. der Zuordnung von Rängen zu den Einheiten von Bindungen gesprochen, da diesen Einheiten bei einer größenmäßigen Ordnung der Messwerte allen derselbe Rang zusteht.
Schematische graphische Darstellung der Quartile sowie des Minimums und des Maximums der Messwerte eines metrischen Merkmals.
D
Bei den Merkmalsträgern für ein Merkmal oder mehrere Merkmale beobachtete Ausprägungen, die einzelnen Daten werden auch als Messwerte bezeichnet .
Siehe Regression.
Siehe Unabhängigkeit.
Auf das Intervall 0 bis 1 beschränktes Maß für den Erklärungsgehalt einer linearen Regression zweier (oder mehrerer) metrischer Merkmale. Im Fall der linearen Einfachregression gleich dem Quadrat des Korrelationskoeffizienten von Bravais-Pearson der beiden betrachteten Merkmale. Wird auch als Bestimmtheitskoeffizient oder spezielles Bestimmtheitsmaß bezeichnet.
Quantile für p=0,10; 0,20; 0,30; ...; 0,90.
Bei einer Erhebung Erfassen der Häufigkeiten des Auftretens der einzelnen Merkmalsausprägungen und Zuordnen der Häufigkeiten zu den Ausprägungen.
Syn. für relative Konzentration.
DISPARITÄTSKOEFFIZIENT VON GINI
Spezielles Disparitätsmaß. Zweifache Fläche zwischen der Lorenzkurve und der Diagonalen des Einheitsquadrats. Syn.: Ginikoeffizient.
Größen zur Messung der Disparität. Siehe Disparitätskoeffizient von Gini, Variationskoeffizient.
Syn. für Streuungsmaße.
DURCHSCHNITTLICHE ABSOLUTE ABWEICHUNG
Spezielles absolutes Streuungsmaß. Arithmetisches Mittel der Abweichungen der auftretenden Messwerte von einer vorgegebenen reellen Zahl. Als Bezugsgröße wird meistens der Median der Messwerte verwendet und die resultierende Größe dann als durchschnittliche oder mittlere absolute Abweichung vom Median bezeichnet. Syn.: mittlere absolute Abweichung.
DURCHSCHNITTLICHE QUADRATISCHE ABWEICHUNG
Spezielles absolutes Streuungsmaß. Arithmetisches Mittel der Quadrate der Abweichungen der auftretenden Messwerte von einer vorgegebenen reellen Zahl. Als Bezugsgröße wird meistens das aritmethische Mittel der Messwerte verwendet und die resultierende Größe dann als Varianz der Messwerte bezeichnet.
E
Syn. für relative Häufigkeitsdichte.
EMPIRISCHE VERTEILUNGSFUNKTION
Funktion, die den Anteil der Merkmalsträger angibt, die einen Merkmalswert kleiner oder gleich einem vorgegebenen Wert annehmen. Setzt ein mindestens ordinalskaliertes Merkmal voraus. Syn.: Verteilungsfunktion. Siehe auch Häufigkeitssummenfunktion.
Gewinnung von statistischen Informationen über den Zustand oder das Geschehen in Bereichen unserer Umwelt.
Einheit, bei der eine Erhebung durchgeführt wird.
Bei einer Erhebung erfasstes Merkmal, das zur statistischen Verwendung bestimmt ist. Siehe Hilfsmerkmal.
F
Siehe Index vom Typ Fisher.
G
Syn. für Grundgesamtheit.
Syn. für Disparitätskoeffizient von Gini.
Spezielles absolutes Streuungsmaß. Arithmetisches Mittel aus den Absolutbeträgen der Differenzen der Messwerte zweier beliebiger Einheiten.
Syn. für gleitender Mittelwert.
Quotient einer nichtnegativen Kenngröße für eine Teilmenge zu der entsprechenden Kenngröße für die Gesamtmenge von Einheiten. Siehe Quote.
Menge von Merkmalsträgern (Erhebungseinheiten), bei denen Informationen bzgl. eines Merkmals oder mehrerer Merkmale erhoben werden
sollen. Syn.: Gesamtheit, häufig auch Auswahlgesamtheit.
H
- absolute ~:
Anzahl der Einheiten, die einen vorgegebenen Merkmalswert annehmen bzw. in eine vorgegebene Merkmalsklasse fallen. Siehe Häufigkeitsfunktion.
- bedingte ~:
In einer zweidimensionalen Häufigkeitstabelle die (absoluten oder relativen) Häufigkeiten für die Verteilung des einen Merkmals, wenn
für das andere Merkmal eine Merkmalsausprägung vorgegeben ist.
- relative ~:
Anteil der Einheiten, die einen vorgegebenen Merkmalswert annehmen bzw. in eine vorgegebene Merkmalsklasse fallen. Siehe Häufigkeitsfunktion.
- absolute ~:
Bei einem klassierten Merkmal durch die jeweilige Klassenbreite dividierte absolute Häufigkeit der betreffenden Klasse.
- relative ~:
Bei einem klassierten Merkmal durch die jeweilige Klassenbreite dividierte relative Häufigkeit der betreffenden Klasse. Syn.: empirische Dichte.
Bei einem klassierten Merkmal Funktion, die jeder Klasse die zugehörige (absolute oder relative) Häufigkeitsdichte zuordnet. Bei ungleichen Klassenbreiten u. a. zur graphischen Darstellung der Häufigkeitsfunktion eines Merkmals notwendige Korrektur der Häufigkeitsfunktion, siehe Histogramm.
- eindimensionale ~:
Funktion, die jedem Merkmalswert bzw. jeder Merkmalsklasse die Anzahl (absolute Häufigkeit) bzw. den Anteil (relative Häufigkeit) der Einheiten in einer gegebenen Masse zuordnet, deren Messwerte gleich diesem Merkmalswert sind bzw. in diese Klasse fallen. Durch die Häufigkeitsfunktion wird die absolute bzw. relative (eindimensionale) Häufigkeitsverteilung eines Merkmals in einer gegebenen Masse vollständig beschrieben. Sofern jeder aufgetretene Merkmalswert mit seiner Häufigkeit aufgeführt wird, wird auch von gruppierten oder diskret klassierten Messwerten bzw. Daten, bei einer Einteilung des Wertebereichs des Merkmals in disjunkte Intervalle (Klassen) von stetig klassierten Messwerten bzw. Daten oder einem klassierten Merkmal gesprochen.
- bedingte ~:
Eindimensionale Häufigkeitsfunktion eines Merkmals, bei der für ein weiteres Merkmal eine Merkmalsausprägung vorgegeben ist.
- zweidimensionale ~:
Funktion, die für zwei Merkmale jeder Kombination eines Merkmalswertes des einen Merkmals und eines Merkmalswertes des anderen Merkmals die Anzahl (absolute Häufigkeit) bzw. den Anteil (relative Häufigkeit) der Einheiten in einer gegebenen Masse zuordnet, deren Messwerte bzgl. der beiden Merkmale gleich diesen Merkmalswerten sind. Analog bei stetig klassierten Messwerten.
Streckenzug, der sich durch die lineare Verbindung der Ordinaten aufeinanderfolgender Klassenmitten im Histogramm ergibt, wobei das Histogramm an den Rändern zuvor durch zwei fiktive Klassen mit den Häufigkeiten Null ergänzt wird.
Funktion, die die Anzahl der Merkmalsträger, die einen Merkmalswert kleiner oder gleich einem vorgegebenen Wert annehmen, angibt. Setzt ein mindestens ordinal skaliertes Merkmal voraus. Siehe auch empirische Verteilungsfunktion.
- eindimensionale ~:
Tabelle, die die Häufigkeiten einer eindimensionalen Häufigkeitsfunktion enthält.
- zweidimensionale ~:
Tabelle, die die Häufigkeiten einer zweidimensionalen Häufigkeitsfunktion enthält. Syn.: Kontingenztafel.
Die Verteilung der Einheiten bzgl. eines betrachteten Merkmals (oder mehrerer Merkmale) auf die Merkmalsausprägungen wird durch die
Häufigkeitsfunktion bzw. die empirische Verteilungsfunktion vollständig beschrieben.
Spezielles Maß für die absolute Konzentration. Summe der Quadrate der Anteile der Einheiten an der Merkmalssumme.
Merkmal, das nur der technischen Durchführung einer Erhebung dient. Siehe Erhebungsmerkmal.
Graphische Darstellung der Häufigkeitsfunktion eines klassierten Merkmals. Siehe auch Häufigkeitsdichtefunktion.
I
Siehe Index vom Typ Fisher.
Mittelwert von Messzahlen. Syn.: Indexzahl.
- ~ vom Typ Fisher:
Geometrisches Mittel aus einem Index vom Typ Laspeyres und einem auf denselben Daten basierenden vergleichbaren Index vom Typ Paasche. Wird wegen seiner guten Eigenschaften auch als Idealindex bezeichnet; für Fisher-Indizes gilt im Gegensatz zu Laspeyres- bzw. Paasche-Indizes beispielsweise, dass das Produkt aus einem Preis- und einem Mengenindex einen Wertindex ergibt.
- ~ vom Typ Laspeyres:
Arithmetisches Mittel von Preis- oder Mengenmesszahlen des zeitlichen Vergleichs, bei denen als Gewichte Werte aus der Basiszeit Verwendung finden.
- ~ vom Typ Paasche:
Harmonisches Mittel von Preis- oder Mengenmesszahlen des zeitlichen Vergleichs, bei denen als Gewichte Werte aus der Berichtszeit Verwendung finden.
Syn. für Index.
- Aggregation von Sub~en:
Zusammenfassung von Indexzahlen gleichen Typs und gleicher Art für Teilmengen (sogenannten Subindexzahlen) zu einem Index für die aus diesen Teilmengen bestehende Gesamtmenge.
- Arten von ~en:
- sachliche Verkettung von ~en:
Verknüpfung von Preis-, Mengen- und Wertindexzahlen.
- Typen von ~en:
Fisher-, Laspeyres-, Paasche-Index.
- Umbasierung von ~en:
Veränderung der Basiszeit und daraus resultierende Neuberechnung einer gegebenen Folge von Indexzahlen.
- zeitliche Verkettung von ~en:
Verknüpfung zweier Folgen von Indexzahlen desselben Typs und derselben Art mit unterschiedlicher Basiszeit zu einer durchgehenden Folge von Indexzahlen mit einheitlicher Basiszeit.
Bestimmt dadurch, dass Rangfolge und Abstand zwischen den Merkmalswerten definiert sind; diese Skala ist gegenüber ordnungserhaltenden linearen Transformationen invariant. Siehe metrisches Merkmal.
K
Syn. für metrische Skala. Siehe metrisches Merkmal.
- statistische ~:
Zahlenwert, der einer Menge von Einheiten bzgl. eines Merkmals zugeordnet wird.
Differenz zwischen der Klassenobergrenze und der Klassenuntergrenze einer Klasse.
Einteilung des Wertebereichs eines metrischen Merkmals in disjunkte Intervalle; wird zur Vereinfachung der Datenerhebung bzw. der Datenanalyse häufig bei kontinuierlichen Merkmalen - mitunter auch bei diskreten Merkmalen - verwendet; die einzelnen Intervalle werden auch als Merkmalsklassen bezeichnet. Bei einer Erhebung wird in diesem Fall auch von stetig klassierten Messwerten gesprochen.
Bei einer Klasseneinteilung werden die Grenzen jedes Intervalls als Klassenobergrenze bzw. Klassenuntergrenze des betreffenden Intervalls bezeichnet.
Mitte eines Intervalls bei der Klasseneinteilung, bestimmt sich als arithmetisches Mittel aus Klassenobergrenze und Klassenuntergrenze der betreffenden Klasse. Syn.: Klassenmittelpunkt.
Syn. für Klassenmitte.
Arithmetisches Mittel der Messwerte der in dieselbe Klasse fallenden Einheiten. Ist der Klassenmittelwert nicht bekannt oder nicht bestimmbar, wird er durch die Klassenmitte ersetzt.
Siehe Zerlegung einer Zeitreihe.
KONTINGENZKOEFFIZIENT VON PEARSON
Auf das Intervall von 0 bis 1 normiertes Maß für die Abhängigkeit zweier beliebig skalierter Merkmale.
Syn. für zweidimensionale Häufigkeitstabelle.
Bei der Konzentrationsmessung wird von einem extensiven, metrischen Merkmal ausgegangen, das keine negativen Werte annimmt, und zwischen absoluter und relativer Konzentration unterschieden. Häufig wird unter Konzentrationsmessung nur die Messung absoluter Konzentration verstanden und die Messung relativer Konzentration dem Begriff der Disparitätsmessung zugeordnet.
- absolute ~:
Absolute Konzentration liegt vor, falls eine kleine Anzahl von Merkmalsträgern einen großen Anteil der Merkmalssumme auf sich vereinigt. Mitunter wird statt von absoluter Konzentration kurz von Konzentration gesprochen. Siehe Konzentrationsmaße, Konzentationskurve, Konzentrationsrate.
- relative ~:
Relative Konzentration liegt vor, falls ein kleiner Anteil von Merkmalsträgern einen großen Anteil der Merkmalssumme auf sich vereinigt. Syn.:
Disparität. Siehe Disparitätsmaße, Lorenzkurve, Lorenzrate.
KONZENTRATIONSINDEX VON ROSENBLUTH
Syn. für Konzentrationskoeffizient von Rosenbluth.
KONZENTRATIONSKOEFFIZIENT VON ROSENBLUTH
Spezielles Maß für die absolute Konzentration. Entspricht dem Kehrwert der mit zwei multiplizierten Fläche zwischen der Konzentrationskurve und der konstanten Funktion 1. Syn.: Konzentrationsindex von Rosenbluth, Rosenbluth-Index.
Streckenzug, der sich aus der Darstellung und der linearen Verbindung aufeinanderfolgender Konzentrationsraten in einem kartesischen Koordinatensystem ergibt.
Größen zur Messung der absoluten Konzentration. Siehe Konzentrationskoeffizient von Rosenbluth, Herfindahl-Index.
Die Konzentrationsrate der Ordnung i gibt den Anteil an, den die i größten Merkmalsträger an der gesamten Merkmalssumme haben.
KORRELATIONSKOEFFIZIENT VON BRAVAIS-PEARSON
Auf das Intervall von -1 bis +1 beschränktes Maß für den linearen Zusammenhang zweier metrischer Merkmale.
Maß für die gemeinsame Variation bzw. den Zusammenhang zweier metrischer Merkmale. Syn. mitunter empirische Kovarianz.
L
Syn. für Lokalisationsmaße.
Betrachtung der zeitlichen Entwicklung eines Merkmals. Siehe Querschnittbetrachtung.
Syn. für Index vom Typ Laspeyres.
Siehe Regression.
Maße, die den Mittelpunkt bzw. den Schwerpunkt einer eindimensionalen Häufigkeitsverteilung wiedergeben sollen. Syn.: Lagemaße. Siehe Modus, Median, arithmetischer Mittelwert. Mitunter werden auch geometrischer und harmonischer Mittelwert zu den Lokalisationsmaßen gezählt.
Streckenzug, der sich aus der Darstellung und der linearen Verbindung aufeinanderfolgender Lorenzraten in einem kartesischen Koordinatensystem ergibt, auf dessen Abszisse der Anteil der Merkmalsträger abgetragen wird.
Die Lorenzrate der Ordnung i gibt den Anteil an, den die i kleinsten bzw. (i/n)·100 Prozent kleinsten Merkmalsträger an der gesamten Merkmalssumme haben (n=Anzahl der erfassten Merkmalsträger).
M
Quantil für p=0,5; Lokalisationsmaß für mindestens ordinal skalierte Merkmale. Syn.: Zentralwert, 0,5-Quantil.
Mittelwert von Mengenmesszahlen. Siehe Index.
Messzahl zur Darstellung der zeitlichen Mengenentwicklung eines Gutes bzw. zum räumlichen Mengenvergleich.
Bei einer Erhebung interessierende Eigenschaft der Untersuchungseinheiten.
- dichotomes ~:
Merkmal, dessen Wertebereich nur zwei Merkmalsausprägungen umfasst.
- diskretes ~:
Merkmal, dessen Wertebereich endlich oder abzählbar unendlich viele Merkmalswerte aufweist.
- extensives ~:
Metrisches Merkmal, bei dem die Summe der bei den einzelnen Merkmalsträgern auftretenden Messwerte sinnvoll interpretiert werden kann.
- häufbares ~:
Merkmal, das bei ein und demselben Merkmalsträger mit verschiedenen Ausprägungen auftreten kann.
- Klasseneinteilung eines ~:
Siehe Klasseneinteilung.
- klassifikatorisches ~:
Syn. für nominales Merkmal.
- komparatives ~:
Syn. für ordinales Merkmal.
- kontinuierliches ~:
Merkmal, dessen Wertebereich überabzählbar viele Merkmalswerte umfasst. Häufig verwendetes Syn.: stetiges Merkmal.
- metrisches ~:
Merkmal, für dessen mögliche Ausprägungen sich mindestens Rangfolgen und Abstände (Differenzen) bilden lassen. Syn.: quantitatives Merkmal. Die Messung derartiger Merkmale erfolgt auf einer metrischen Skala. Ist diese invariant gegenüber ordnungserhaltenden linearen Transformationen, so wird von einer Intervallskala gesprochen. Ist zusätzlich noch ein natürlicher Nullpunkt gegeben und somit das Verhältnis zweier Merkmalswerte sinnvoll definiert, so liegt eine Verhältnisskala vor, auf der ordnungserhaltende ähnliche Transformationen erlaubt sind. Weist das Merkmal zusätzlich eine natürliche Einheit auf, so resultiert eine Absolutskala, die keine bzw. nur identische Transformationen der Merkmalswerte erlaubt. Syn.: metrisch skaliertes Merkmal.
- nominales ~:
Merkmal, dessen mögliche Ausprägungen nur artmäßig unterschieden werden (zugehörige Skala Nominalskala). Syn.: klassifikatorisches Merkmal, nominal skaliertes Merkmal, mitunter auch qualitatives Merkmal.
- ordinales ~:
Merkmal, dessen mögliche Ausprägungen intensitätsmäßig abgestuft sind und die sich zusätzlich nach einem Ordnungsprinzip in eine Rangfolge bringen lassen. Die Messung derartiger Merkmale erfolgt auf einer Ordinalskala, auf der ordnungserhaltende Transformationen erlaubt sind. Syn.: ordinal skaliertes Merkmal.
- qualitatives ~:
Meist Syn. für nominales Merkmal. Häufig werden alle nichtmetrischen Merkmale als qualitative Merkmale bezeichnet und somit auch ordinale Merkmale zu den qualitativen Merkmalen gerechnet.
- quantitatives ~:
Syn. für metrisches Merkmal.
- statistisches ~:
Bei einer Erhebung interessierende Eigenschaft.
- stetiges ~:
Meist Syn. für kontinuierliches Merkmal.
- unabhängige ~e:
Zwei Merkmale heißen (deskriptiv) unabhängig, falls sich deren zweidimensionale Häufigkeitsverteilung als Produkt der Randverteilungen dieser Merkmale darstellen lässt.
Syn. für Merkmalsausprägungen.
Verschiedene Erscheinungsformen (Ausprägungen), mit denen ein Merkmal auftreten kann. Sind den Merkmalsausprägungen Zahlen zugeordnet, so werden diese als Merkmalswerte bezeichnet. Mitunter wird der Begriff Merkmalsausprägungen auf nichtmetrische Merkmale beschränkt und bei metrischen Merkmalen nur von Merkmalswerten gesprochen, da in diesem Fall die Merkmalsausprägungen bereits Zahlen sind. Syn.: Merkmalsabstufung.
Siehe Klasseneinteilung.
Summe der bei den einzelnen Merkmalsträgern auftretenden Messwerte, setzt metrisches Merkmal voraus.
Die Erhebungseinheiten, die Träger des jeweils betrachteten Merkmals sind.
Zahlen, die den Ausprägungen eines Merkmals zugeordnet werden.
Die einzelnen bei einer Erhebung anfallenden Daten. Siehe statistisches Urmaterial. Um die Anzahl der Einheiten, die dieselbe Merkmalsausprägung aufweisen bzw. deren Merkmalswert in dieselbe Klasse fällt, zu erfassen, werden die Messwerte diskret oder stetig klassiert, siehe Häufigkeitsfunktion.
Quotient aus zwei sachlich übereinstimmenden Kenngrößen, die sich auf zeitlich oder räumlich voneinander verschiedene Mengen von Einheiten beziehen.
- Bezugswert einer ~:
Kenngröße, die bei der Berechnung einer Messzahl als Vergleichsgröße aller Kenngrößen dient und demnach im Nenner des Quotienten steht.
- mit konstanter Bezugszeit:
Messzahl, bei der die Bezugszeit unabhängig von der Berichtszeit konstant ist.
- mit variabler Bezugszeit:
Messzahl, bei der die Berichtszeit mit der Bezugszeit variiert.
- Mittelwerte von ~en des zeitlichen Vergleichs:
Zur Bestimmung des durchschnittlichen Zuwachsfaktors bzw. der durchschnittlichen Zuwachsrate einer Folge von Messzahlen des zeitlichen Vergleichs wird das geometrische Mittel verwendet.
- sachliche Verkettung von ~en:
Verknüpfung von Preis-, Mengen- und Wertmesszahlen.
- Umbasierung von ~en:
Ändern der Basiszeit und daraus resultierende Neuberechnung einer gegebenen Folge von Messzahlen.
- zeitliche Verkettung von ~en:
Verknüpfung zweier Folgen von Messzahlen desselben Typs und derselben Art mit unterschiedlicher Basiszeit zu einer durchgehenden Folge von Messzahlen mit derselben Basiszeit.
METHODE DER KLEINSTEN QUADRATE
Methode zur Bestimmung der unbekannten Parameter einer Regressions- bzw. Trendfunktion, bei der die Summe der Quadrate der Abweichungen zwischen den aus der jeweiligen Gleichung resultierenden und den empirischen Werten minimiert wird.
- ?-getrimmter ~:
Spezielles arithmetisches Mittel bei metrischen Merkmalen, bei dessen Berechnung die ? mal 100 % kleinsten sowie die ? mal 100 % größten Merkmalswerte unberücksichtigt bleiben.
- arithmetischer ~:
Lokalisationsmaß für metrische Merkmale. Durch die Anzahl der erfassten Einheiten dividierte Summe der Messwerte dieser Einheiten. Syn.: arithmetisches Mittel.
- bedingter arithmetischer ~:
Arithmetischer Mittelwert einer bedingten Häufigkeitsverteilung.
- geometrischer ~:
n-te Wurzel aus dem Produkt der Messwerte der n Einheiten einer Erhebung; setzt ein metrisches Merkmal und positive Messwerte voraus. Syn.:geometrisches Mittel.
- gleitender ~:
Ersatz der Werte einer Zeitreihe durch Mittelwerte aus dem jeweiligen ursprünglichen Wert sowie zeitlich vorangehenden und nachfolgenden Werten.
- harmonischer ~:
Reziproker Wert des arithmetischen Mittels der Kehrwerte der Messwerte einer Erhebung; setzt ein metrisches Merkmal und Messwerte voraus, die entweder alle positiv oder alle negativ sind. Syn.: harmonisches Mittel.
Syn. für durchschnittliche absolute Abweichung.
Lokalisationsmaß für beliebig skalierte Merkmale. Merkmalsausprägung, für die die Häufigkeitsfunktion bzw. bei klassierten Merkmalen das
Häufigkeitspolygon ein (globales) Maximum besitzt.
Siehe multiplikative Zerlegung einer Zeitreihe.
N
Siehe nominales Merkmal.
O
Siehe ordinales Merkmal.
P
Syn. für Index vom Typ Paasche.
Wiederholte Durchführung einer inhaltlich (weitgehend) unveränderten Befragung bei denselben Erhebungseinheiten zu unterschiedlichen Zeiten.
Quantile für p=0,01; 0,02; ... ; 0,99.
Siehe Quantil.
Mittelwert von Preismesszahlen. Siehe Index.
Messzahl zur Darstellung der zeitlichen Preisentwicklung eines Gutes bzw. zum räumlichen Preisvergleich.
Statistik, deren Datenmaterial eigens für den jeweiligen Verwendungszweck erhoben wurde. Gegensatz: Sekundärstatistik.
Q
Kleinster Merkmalswert, der von p mal 100 Prozent der Merkmalsträger einer Erhebung erreicht oder unterschritten wird (0 < p < 1); Berechnung setzt ein mindestens ordinal skaliertes Merkmal voraus. Syn.: p-Quantil. Spezielle Quantile sind: Dezile,
Median, Perzentile, Quartile, Quintile.
Quantile für p=0,25; 0,50; 0,75.
Spezielles absolutes Streuungsmaß. Differenz zwischen dem dritten und dem ersten Quartil.
- relativer ~:
Spezielles relatives Streuungsmaß. Durch das arithmetische Mittel aus dem ersten und dem dritten Quartil dividierter Quartilabstand. Syn.:
Quartilkoeffizient.
Syn. für relativer Quartilabstand.
Betrachtung eines Merkmals zu einem Zeitpunkt bzw. in einem Zeitraum bei verschiedenen Merkmalsträgern. Im Gegensatz zur
Längsschnittbetrachtung steht der Vergleich zwischen den Merkmalsträgern im Vordergrund.
Quantile für p=0,20; 0,40; 0,60; 0,80.
Meist mit 100 multiplizierte und somit in Prozent angegebene Gliederungszahl.
Syn. für Verhältnisskala.
R
In einer Kontingenztafel (eindimensionale) Verteilung eines der beiden Merkmale ohne jeglichen Bezug auf das andere Merkmal.
r heißt die Rangzahl oder der Rang eines Messwertes, falls dieser in der Reihenfolge der aufsteigend geordneten Werte an r-ter Stelle steht und von allen anderen Messwerten verschieden ist. Falls Bindungen auftreten, d. h. mehrere Einheiten denselben Merkmalswert aufweisen, wird allen diesen Messwerten derselbe durchschnittliche Rang zugeordnet.
RANGKORRELATIONSKOEFFIZIENT VON SPEARMAN
Auf das Intervall von -1 bis +1 beschränktes Maß für den linearen Zusammenhang im Sinne einer Rangordnung zweier mindestens ordinal skalierter Merkmale.
Syn. für Rang eines Messwertes.
Relative oder prozentuale Veränderung einer Größe; in der Bevölkerungsstatistik häufig im Sinne von Ziffer verwendet.
Syn. für Berichtszeit.
Unterstellung eines funktionalen Zusammenhangs zwischen einer abhängigen Variablen und einer oder mehrerer unabhängigen Variablen.
- lineare Einfach~:
Lineare Beziehung zwischen einer unabhängigen und einer abhängigen metrischen Variablen. Syn.: (deskriptive) Regression 2. Art.
- (deskriptive) ~ 1. Art ~:
Bei einer zweidimensionalen Häufigkeitsverteilung Zuordnung der bedingten arithmetischen Mittelwerte eines metrischen Merkmals zu den Werten des anderen (beliebig skalierten) Merkmals. Mitunter auch lineare Verbindung der in einem kartesischen Koordinatensystem dargestellten bedingten arithmetischen Mittelwerte eines metrischen Merkmals in Abhängigkeit von den Werten des anderen Merkmals. Siehe auch lineare Einfachregression (Regression 2. Art). Regression 1. und Regression 2. Art werden mitunter auch beide als deskriptive Regression bezeichnet.
- (deskriptive) ~ 2. Art.:
Syn. für lineare Einfachregression.
Aufgrund der Annahme einer linearen Beziehung zwischen zwei (oder mehr) metrischen Merkmalen bestimmte Funktion. Das durch die Regressionsgerade zu erklärende Merkmal wird abhängige Variable, die erklärenden Merkmale werden unabhängige Variable genannt.
In eine Regressionsbeziehung eingehende Parameter außer der Regressionskonstanten.
Größe, deren Wert die abhängige Variable einer Regressionsbeziehung nach annimmt, falls alle unabhängigen Variablen Null sind; bei einer linearen Einfachregression gibt dieser Wert den Schnittpunkt der Regressionsgeraden mit der Ordinate an.
Parameter einer Regressionsgleichung. Durch die Werte der Parameter wird die Regressionsgleichung vollständig bestimmt.
Bei einer Regression Differenz zwischen empirischen und den aufgrund der Regressionsbeziehung ermittelten Werten der
abhängigen Variablen.
Teil einer Zeitreihe, der den nicht als glatte Komponente, zyklische Komponente oder Saisonkomponente identifizierten Teil dieser Zeitreihe enthält.
Syn. für statistisches Urmaterial.
Syn für Konzentrationskoeffizient von Rosenbluth.
S
Siehe saisonbereinigte Zeitreihe.
Saisonkomponente innerhalb eines Jahres.
Siehe Saisonkomponente einer Zeitreihe.
Syn. für Saisonfigur.
SCHWERPUNKT EINER ZWEIDIMENSIONALEN VERTEILUNG
Bei einer Häufigkeitsverteilung zweier metrischer Merkmale das Wertepaar, das aus den arithmetischen Mitteln der beiden Merkmale besteht.
Statistik, deren Datenmaterial ursprünglich für einen anderen Zweck erhoben wurde, als den, für den es eingesetzt wird. Gegensatz: Primärstatistik.
Spezielles absolutes Streuungsmaß. Halbe Differenz zwischen dem dritten und dem ersten Quartil.
Vorschrift zur Messung der Ausprägungen eines Merkmals. Siehe Absolutskala, Intervallskala, Kardinalskala, Nominalskala, Ordinalskala, Verhältnisskala.
- metrische ~:
Bestimmt dadurch, dass mindestens Rangfolge und Abstand zwischen Merkmalswerten definiert sind. Syn.: Kardinalskala. Siehe Absolutskala, Intervallskala, Verhältnisskala, metrisches Merkmal.
Spezielles absolutes Streuungsmaß. Differenz zwischen dem größten und dem kleinsten bei einer Erhebung auftretenden Messwert.
Spezielles absolutes Streuungsmaß. Positive Quadratwurzel aus der Varianz.
Bei einer Erhebung anfallende Menge von Daten; die einzelnen Daten werden auch als Messwerte bezeichnet. Syn.: Rohdaten, Urliste.
Siehe Klasseneinteilung.
Erhebung, bei der die zu erhebenden Merkmale nur von einem Teil der interessierenden Einheiten erfragt werden. Syn.: Teilerhebung. Gegensatz: Vollerhebung.
Graphische Darstellung der bei der gleichzeitigen Erhebung zweier Merkmale bei denselben Einheiten anfallenden Wertepaare in einem kartesischen Koordinatensystem.
Maße für die Streuung (Abweichung) der Messwerte voneinander bzw. von einem Lokalisationsmaß oder einem anderen vorgegebenen Wert; wegen der Verwendung der Differenzen von Messwerten auf metrische Merkmale beschränkt. Streuungsmaße geben an, wie stark innerhalb einer Häufigkeitsverteilung die Messwerte voneinander bzw. von einem Lokalisationsmaß oder einem anderen vorgegebenen Wert abweichen. Syn.: Dispersionsmaße. Siehe Spannweite, Quartilabstand, Semiquartilabstand, relativer Quartilabstand, Gini's mittlere Differenz, durchschnittliche absolute Abweichung vom Median, Varianz, Standardabweichung, Variationskoeffizient.
- absolute ~:
Spannweite, Quartilabstand, Semiquartilabstand, Gini's mittlere Differenz, durchschnittliche absolute Abweichung vom Median, Varianz, Standardabweichung.
- relative ~:
Streuungsmaße, bei denen zur besseren Vergleichbarkeit absolute Streuungsmaße durch den korrespondierenden Mittelwert dividiert werden. Siehe relativer Quartilabstand, Variationskoeffizient.
Entsprechende Interpretation wie beim Varianzverschiebungssatz, falls in diesem die Varianz jeweils durch die Streuung (=mit Anzahl der
Einheiten multiplizierte Varianz) ersetzt wird.
Entsprechende Interpretation wie beim Varianzzerlegungssatz, falls in diesem die Varianz jeweils durch die Streuung (=mit Anzahl der
Einheiten multiplizierte Varianz) ersetzt wird.
Index für eine Teilmenge des insgesamt interessierenden Güterbündels.
T
Syn. für Stichprobe.
Teilmenge einer Gesamtheit.
Syn. für Vollerhebung.
Siehe Trend einer Zeitreihe.
Siehe trendbereinigte Zeitreihe.
Funktionale Beziehung zwischen der Zeit und dem Trend einer Zeitreihe. Häufig wird ein linearer oder ein exponentieller Trend unterstellt.
U
Änderung der Basiszeit einer Messzahl bzw. einer Indexzahl. Siehe Umbasierung von Messzahlen bzw. von Indexzahlen.
Anzahl der Einheiten einer (Teil-)Gesamtheit.
Siehe unabhängige Merkmale.
Träger interessierender Merkmale.
Menge der Untersuchungseinheiten.
Syn. für statistisches Urmaterial.
V
Spezielles absolutes Streuungsmaß. Arithmetisches Mittel der Quadrate der Abweichungen der auftretenden Messwerte von ihrem arithmetischen Mittel. Syn.: durchschnittliche quadratische Abweichung vom arithmetischen Mittel.
Durch eine Zerlegung der Gesamtheit von Daten in disjunkte Teilgesamtheiten erreichte Aufspaltung der Varianz eines Merkmals in zwei Teile (interne und externe Varianz). Wird in seiner Anwendung auf die Berechnung der Varianz einer aus mehreren disjunkten Teilgesamtheiten bestehenden Gesamtheit auch als Additionssatz für Varianzen bezeichnet. Bei der linearen Einfachregression Zerlegung der Varianz der abhängigen Variablen in die durch die unabhängige Variable erklärte Varianz und die nichterklärte Varianz, ähnlich bei der Regression 1. Art. Siehe auch Streuungszerlegungssatz.
Formel, die angibt, wie sich die durchschnittliche quadratische Abweichung gegebener Messwerte von einer beliebigen reellen Zahl von der Varianz unterscheidet. Syn.: Verschiebungssatz der Varianz. Siehe auch Streuungsverschiebungssatz.
Spezielles relatives Streuungsmaß für Merkmale mit nichtnegativem Wertebereich. Quotient aus Standardabweichung und arithmetischem Mittel. Auch als Disparitätsmaß verwendbar.
Bestimmt dadurch, dass Rangfolge, Abstand und Verhältnis zweier Merkmalswerte definiert sind; invariant gegenüber ordnungserhaltenden ähnlichen Transformationen. Es existiert ein natürlicher Nullpunkt. Syn.: Quotientenskala.
Quotient von statistischen Kenngrößen: Beziehungszahl, Gliederungszahl, Messzahl.
Siehe Verkettung von Messzahlen bzw. von Indexzahlen.
Syn. für Varianzverschiebungssatz.
Siehe empirische Verteilungsfunktion bzw. Häufigkeitsfunktion.
Syn. für empirische Verteilungsfunktion.
Zweidimensionale Häufigkeitstabelle für den Fall, dass bei beiden betrachteten Merkmalen nur zwei Merkmalsausprägungen vorliegen bzw. nur zwei Merkmalsausprägungen unterschieden werden.
Erhebung, bei der die zu erhebenden Merkmale bei allen interessierenden Einheiten erfragt werden. Syn.: Totalerhebung. Gegensatz: Stichprobe.
W
Siehe Zuwachskoeffizient.
Meist Syn. für Zuwachsrate.
Mittelwert von Wertmesszahlen. Siehe Index.
Messzahl zur Darstellung der zeitlichen Wertentwicklung eines Gutes bzw. zum räumlichen Wertvergleich.
Z
Menge von Beobachtungsdaten, die der Zeit nach geordnet sind.
- additive Zerlegung einer ~:
Zerlegung einer ökonomischen Zeitreihe in vier Komponenten (Trend, zyklische Komponente, Saisonkomponente, irreguläre Komponente), bei der die Zeitreihe sich additiv aus diesen Komponenten zusammensetzt.
- äquidistante ~:
Zeitreihe, bei der die Abstände zwischen den Beobachtungszeitpunkten bzw. den (gleich großen) Beobachtungszeiträumen alle übereinstimmen.
- glatte Komponente einer ~:
Durch Zusammenfassung von Trend und zyklischer Komponente einer Zeitreihe entstehende Komponente, wird mitunter auch als Trend bezeichnet.
- irreguläre Komponente einer ~:
Restkomponente, die alle nicht im Trend, zyklischer Komponente oder Saisonkomponente enthaltenen Schwankungen erfasst.
- Komponenten einer ökonomischen ~:
Trend, zyklische Komponente, Saisonkomponente, irreguläre Komponente (evt. glatte Komponente).
- multiplikative Zerlegung einer ~:
Zerlegung einer ökonomischen Zeitreihe in vier Komponenten (Trend, zyklische Komponente, Saisonkomponente, irreguläre Komponente), bei der die Zeitreihe sich multiplikativ aus den Komponenten zusammensetzt.
- saisonbereinigte ~:
Zeitreihe, aus der die Saisonkomponente eliminiert wurde.
- Saisonkomponente einer ~:
Kurzfristige Bewegungskomponente, die die periodischen, innerhalb eines Zeitraumes von einem Jahr auftretenden, jahreszeitlich bedingten Schwankungen des betrachteten Merkmals im Zeitablauf wiedergibt.
- Trend einer ~:
Langfristige Entwicklungskomponente, die die Veränderungstendenz des Merkmals im Zeitablauf wiedergibt; der Begriff Trend wird mitunter auch als Syn. für die glatte Komponente verwendet.
- trendbereinigte ~:
Zeitreihe, aus der der Trend eliminiert wurde.
- zyklische Komponente einer ~:
Mittelfristige Komponente, die die Konjunkturschwankungen des Merkmals im Zeitablauf wiedergibt.
Graphische Darstellung der Werte einer Zeitreihe in einem kartesischen Koordinatensystem, auf dessen Abszisse die Zeit und auf dessen Ordinate das jeweils betrachtete Merkmal abgetragen wird.
Kurve, die durch die lineare Verbindung der zeitlich aufeinanderfolgenden Punkte in einem Zeitreihendiagramm entsteht; sinnvolle Interpretation der Kurve zwischen den Punkten ist nur bei Bestandsgrößen möglich.
Syn. für Median.
Quotient aus einer Bewegungsgröße und derjenigen Bestandsgröße, die die Bewegungsgröße hervorbringt, meist mit 1000 multipliziert.
Größen zur Messung des Zusammenhangs zwischen Merkmalen. Siehe Kovarianz, Kontingenzkoeffizient von Pearson, Korrelationskoeffizient von Bravais-Pearson, Rangkorrelationskoeffizient von Spearman. Syn.: Assoziationsmaße.
Messzahl des zeitlichen Vergleichs, bei dem üblicherweise die Zählergröße zeitlich direkt auf die Nennergröße folgt.
Geometrisches Mittel aus zeitlich aufeinanderfolgenden Zuwachsfaktoren.
Um 1 verminderter Zuwachsfaktor. Syn. Wachstumsrate. Die mit 100 Prozent multiplizierte Zuwachsrate gibt die
prozentuale Veränderung der Ausgangsgröße an.
- durchschnittliche ~:
Um 1 verminderter Zuwachskoeffizient.
A B D E F G H I K L M N O P Q R S T U V W Z