Aufgabe 1:
Hier gibt es verschiedene Vorgehensweisen. Vielleicht ist es am einfachsten. wenn man sich eine Tabelle erstellt, in der man die absoluten und auch die relativen Häufigkeiten einträgt.
Insgesamt haben wir 4 Merkmale, nämlich N, S, O und W.
N kommt fünfmal vor, also eine relative Häufigkeit von 0,25 oder 25%.
S kommt neunmal vor, also eine relative Häufigkeit von 0,45 oder 45%.
O kommt dreimal vor, also eine relative Häufigkeit von 0,15 oder 15%.
W kommt dreimal vor, also eine relative Häufigkeit von 0,15 oder 15%.
A) ist richtig, wie man an der obigen Tabelle sieht.
B) ist jedoch falsch, weil das Diagramm 0,25 N, 0,03 S, 0,2 W und 0,2 O enthält.
C) ist wiederum richtig richtig
D) Da es sich um ein ein nominales Merkmal handelt, ist D) falsch. Denn hier haben wir ja ein qualitatives Merkmal vorliegen.
Aufgabe 2:
Zuerst sollte man hier vier verschiedene Klassen bilden.
Klasse 1 von 0 bis 50: (0;50]
Klasse 2 von 50 bis 100: (50;100]
Klasse 3 von 100 bis 150: (100;150]
Klasse 4 von 150 bis 200: (150;200]
Die Klassenmitten sind dann bei 25, 75, 125 und 175
Für die absoluten Häufigkeiten haben wir dann die Werte 90, 20, 70 und 20
Die relativen Häufigkeiten sind mit 0.45, 0.10, 0.35 und 0.10 gemäß der obigen absoluten Häufigkeiten schnell berechnet.
Dann bestimmen wir die Fj zu 0.45, 0.55(=0,45+0,10), 0.90(=0,55+0,35), 1.00(=0,9+0,1)
A) Der Median findet man bei 50% der Beobachtungswerte, also hier in der Klasse 2 von 50 bis 100. Das arithmetische Mittel kann man dann berechnen zu: 1/200*(2250 + 1500 +8750 +3500) = 80 und hat also den Wert 80.
B) Für die Varianz erhalte ich den Wert 2975
C) Es liegt eine rechtsschiefe Verteilung nach der sogenannten Lageregel von Fechner vor. Weil der x_mod mit 25 kleiner als x_med=75 ist und der Maximalwert bei x_max = 80 ist.
D) Das Lorenzsche Konzentrationsmaß berechnet sich zu (0,45*0,14 + 1*0,09 +1,45*0,55 +1,9*0,22)- 1 = 0,3685
Aufgabe 3:
A) Hier soll der Korrelationskoeffzient nach Bravais-Pearson berechnet werden. Mit der Formel erhalten wir: r = 3,7 * Wurzel(1266/18888) = 0,9579
Die erklärte Varianz kann man aus der Gesamtvarianz berechnen. Diese erhält man aus der Summe der erklärten Varianz und der Restvarianz. Stellen wir um, so bekommen wir die erklärte Varianz: Gesamtvarianz - Restvarianz = 18888 - 1659 = 17229
C) hier ist die Frage, ob der Zusammenhang positiv linear ist. Man kann sich merken, dass ein positiver Regressionskoeffizient notwendig ist, ist ein linearer positiver Zusammenhang gegeben.
Stimmt, da R^2 = 0,9176, also 91,76% der Varianzwerte erklären sich durch lineare Regression.
Aufgabe 4:
Hier kann man sich fragen, wieviele Möglichkeiten in dem Fall gegeben sind, zwei Kugeln ohne Zurücklegen nacheinander zu ziehen.
Für die erste Kugel gibt es 6 Möglichkeiten. Im zweiten Zug sind aber noch nur 5 Kugeln im Top, also bleiben noch 5 Möglichkeiten. Zusammen also 6*5 Möglichkeiten = 30 Möglichkeiten.
Hier kann man rechnen: P(B) = P( (1;4) u (1;5) u ..... u (6;4) u (6;5) =
P(1;4) + ... + P(6;4) + P (6;5) = 15/30 = 1/2
Weil ja gilt, dass die Anzahl günstige Fälle geteilt durch die Anzahl Mögliche Fälle die Wahrscheinlichkeit ergibt.
B) Hier erhält man P (A n B) = P(1;4) + P (1;5) + P(1;6) = 3/30
C) Ich erhalte P (A u B) = P(A) + P(B) - P(A n B)) = 5/30 + 15/30 - 3/30 = 17/30
D) Ich erhalte P(A/B) = P(A n B) / P(B) = 3/30 / 15/30 = 1/5
E) Ich erhalte P(B/A) = 3/5, also sind die Ereignisse A und B abhängig, weil eben nicht gilt, dass P(B/A) gleich P(B) ist.
Aufgabe 5:
Die Wahrscheinlichkeitsverteilung kann man anhand der vorgegebenen Daten nochmals ausführlich aufschreiben:
xi -> f(xi)
-3 -> 0,1
-2 -> 0,2
-1 -> 0,1
0 -> 0,2
1 -> 0,1
2 -> 0,2
3 -> 0,1
Es ist eine diskrete Verteilung. Deshalb kann man immer aufaddieren.
A) Es gilt P(-1 ≤ x ≤ 1) = P(−1)+P(0)+P(1) = 0.1+0.2+0.1 = 0.4
B) Wie in A) auch kann man rechnen: P(−5 ≤ x < 0) = P(−3)+P(−2)+P(−1) = 0.1+0.2+0.1 = 0.4
C) P(0<x<2)=P(1)=0.1
D) Der Erwartungswert hat den Wert Null, weil die Verteilung ist nullsymmetrisch ist
Aufgabe 6:
A) Hier berechnet sich E(Y)= 2*E(X1) − 0,5*E(X2) + 0,57*E(X3) = 2·5 − 14 + 34 = 11
B) Die Varianz kann man mittels des Steinerschen Verschiebungssatzes bestimmen:
Var(X1) ==E(X^2) − [E(X)]^2 = 50 − 25 = 25.
C) Wegen E(Z) = −2*E(X1)+ 0,5* E(X2) = −10+2 = −8
kann man die Varianz der Zufallsvariablen X1 berechnen:
Var(X1) = 25 und Var(X2) = 32 − 16 = 16
Damit habe ich berechnet:
Var(Z) = 4Var(X1) + 0,5* Var(X2) = 100 + 4 = 104.
D) falsch! E(X3^2) ist nicht angegeben
Aufgabe 7:
A) Zuerst bemerken wir, dass X eine (0,1) normalverteilte Zufallsvariable ist.
Dann können wir vereinfachen: P(-2*σ ≤ X ≤ 2*σ)= P(−2 ≤ X ≤ 2)=P(X ≤ 2)−P(X ≤ −2)
= P(X ≤2)−[1−P(X ≤2)]
= 2* P(X ≤2)−1 = 2·0.9772−1=0.9544
B) Wenn der Mittelwert μ = 0 ist, bekomme ich P(−2≤Z≤2)=0.9544
C) Da a-bX normalverteilt ist mit a-b*μ haben wir b^2*σ^2
D) Jede Normalverteilung ist zuerst einmal symmetrisch. Damit kann man P(X≤ μ) zu 0,5 angeben, wenn μ =0 ist.
Aufgabe 8:
A) Ich erhalte x=75 und σ = 12
Für das 95%-Konfidenzintervalls haben wir dann als Grenzen die Werte 73.53 und 76.47.
Dann kann man weiterrechnen, um n zu bekommen
76,47 = 75 + 1,96* 12/Wurzel(n)
Nach etwas umformen ergibt sich für Wurzel(n) der Wert 16 und damit n=256
B) x = 75, σ = 12, n = 144, Konfidenzintervall [72.19; 77.81]
77,81 = 75 + z(1-a/2) *12/12
also ist 77,81 -75 = z(1-a/2)
also kann man mit z=2,81 im Glossar nach alpha = 0,005 nachschlagen
C) Mit der t-Verteilung (es ist sigma unbekannt) kann man das einseitige Konfidenzintervall für μ angeben
(X −t(n−1)* S/Wurzel(n) ; ∞ ).
Damit ist die untere Grenze nun
75 - 2,492* 15/5 = 67,524
und die obere Grenze muss natürlich unendlich sein
D) Weil n>30 ist, kann man die Normalverteilung approximieren:
Für die untere Grenze gilt dann: 75 - 2,33 * 15/10 = 71,505
und die obere Grenze ist natürlich auch unendlich
Aufgabe 9:
A) falsch, für alpha = 0,05 ist keine Ablehnung möglich
B) richtig, H0 wird abgelehnt
richtig, denn das arithmetische Mittel ist sinnvoll, wenn die Zufallsvarialbe X erwartungstreu und effizient ist
D) Das kann hier anhand der Daten nicht ausgesagt werden.
Aufgabe 10:
A) Den χ2- Unabhängigkeitstest kann man nehmen hier, denn es liegen keine Unterschiede in den Fillialen vor. Die Filialen und die Erfolgsquoten sind unabhängige Merkmale.
B) falsch, wir haben ja keine Angaben über die Verteilung
C) falsch
D) man kann berechnen χ2 = 1/30 + 9/15 + 4/15 + 1/20 + 9/10 + 4/10 = 2,25
E) Es ist (2-1)*(3-1) Freiheitsgrade und alpha ist gleich 0,1.
Aus dem Glossar bekommt man den krischen Wert mit 4,605.
Da die Prüfgröße kleiner als der kritische Wert ist, ist die Ablehnung nicht möglich.