StudentInnen in der Stadt

Userbild von frossberg
Userbild von Geo_Surf
Userbild von Chillstar
Userbild von kire.le.beuh
Userbild von Jam
Userbild von claudi-le
Userbild von andropar
Userbild von CajunCountryBoy
Userbild von annele
Userbild von zjyejun

Menschs IchbestehdiePrüfung-Thread

Userbild von Mensch
mensch
am 11.01.06
In einem Monat ist die Statistikprüfung, und für viele ist das einzige, was sie über Statistik wissen, das, dass die Wahrscheinlichkeit P(X="Prüfung bestehen") so ungefähr bei = 0 liegt. Also: Für all diejenigen, denen für die Übungsaufgaben entweder die Lösung oder das Verständnis der Lösung fehlt soll es hier Beistand geben.

Wenn ein paar Leute mal ein paar Seiten ihrer Mitschriften scannen, und wenn jeder, der schon ein bisschen Ahnung hat, hier mithilft um sein eigenes Verstehen zu vertiefen, dann kann es dieses Mal vielleicht einen statistischen "Ausreißer" geben, weil mehr Prüfungen bestanden werden als sonst.

Ich fange mal mit der ersten Aufgabe an. Weil ich, und das vielleicht nicht als einziger, nicht bei der Übung war, kann manches folgende falsch sein und gern korrigiert werden.

1.1.

a)

Grundgesamtheit: Mitarbeiter und Mitarbeiterinnen einer Arbeitsstätte
Untersuchungseinheiten: Haushälte von 50 Mitarbeitern

b)

Merkmal Ausprägung zB Skalenniveau
----------------------------------------------------------------------------------------
Haushaltsgröße | diskret | 5 (Personen) | verhältnis
monatliche Miete | (quasi)-stetig | 500,23 (Euro) | verhältnis
Beförderungsmittel | diskret | 1 = Bus, 2 = Bahn | nominal
Entfernung | (quasi)-stetig | 50,32 (km) | verhältnis
wirtschaftl.Lage | diskret | 1= sehr gut | ordinal

c)

Studientyp: Querschnittsdaten
Einloggen um zu antworten.
Userbild von Mensch
mensch
am 11.01.06
2.1.

a)

die relativen Häufigkeiten

errechnen sich aus

Absolute Häufigkeit / n

n = Gesamtanzahl aller Haushälte

= bei Haushaltsgröße 1:
380131 / 722681 = 0,53

= bei Haushaltsgröße 2:
182838 / 722681 = 0,25 entspricht 25%

usw.

Absolute Häufigkeiten sind Anzahlen, relative Häufigkeiten sowas wie Prozente.

Das Säulendiagramm zeichnet man wie im Skript auf Seite 58. Auf der x-Achse liegen also 1, 2, 3, 4, 5 (Haushaltsgröße) und an der y-Achse stehen die relativen Häufigkeiten, eingeteilt zB. in 0, 0.2, 0.4, 0.6, 0.8, 1.

b ) Und das geht so:
Summe aus Haushaltsgröße * Anzahl der Haushälte
1*380131 + 2*182838 + 3*87444 + 4*52033 + 5*20235

1Personenhaushaltspersonen:
380131
2Personenhaushaltspersonen:
365676
3Personenhaushaltspersonen:
262332
4Personenhaushaltspersonen:
208132
5Personenhaushaltspersonen:
101175

Gesamtpersonen: alles addiert = 1.317.446 Personen

So, und jetzt die Fragestellung
380131 / 1317446 = 0.289 entspricht knapp 29 Prozent < 50 Prozent.

Wir können dieser Aussage also nicht zustimmen.
Einloggen um zu antworten.
Userbild von Mensch
mensch
am 11.01.06
Und nun, obwohl es langsam schwieriger wird, hier die Aufgabe

2.2.)

a)

Und da hat man eine empirische Verteilungsfunktion gegeben. Aus dem Skript geht für mich hervor, dass man eine solche Grafik so liest:

Welche Werte kommen wie oft vor? Das ist die Frage.

n = 100, es gibt also hundert Beobachtungen.

Die Werte sind geordnet und stehen auf der x-Achse. x kann also hier die Werte 1 bis 4 annehmen. Die Häufigkeiten stehen wieder an der y-Achse, und wenn man zum Beispiel bei x=1 schaut, dann sieht man einen Strich in Höhe y=0.2 bis hin zu x=2. Das heisst: 20% der Werte sind kleiner gleich 1.

Das heisst ausserdem, (0.5-0.2) 30% der Werte sind zwischen 1 und 2, insgesamt liegt der Strich also bei y=0,5. Weiter gehts, und dann haben insgesamt schon 80% der Beobachtungen einen Wert kleiner gleich 3, und hundert Prozent haben einen Wert von kleiner gleich 4.

Nochmal in Kurzform
x <= 1 in 20 %
1 < x <= 2 in 30 %
2 < x <= 3 in 30 %
3 < x <= 4 in 20 %
Das ist dann wohl die relative Häufigkeitsverteilung. Die absolute Häufigkeit ist hier sehr einfach auszurechnen, weil es ja 100 Beobachtungen gibt, streicht man also die Prozente hier weg, hat man die absoluten Zahlen.

__________
edit:
Ich glaube, das mit x zwischen 1 und 2 und so weiter ist hier zweifelhaft, weil x wahrscheinlich ausschließlich die Werte 1 oder 2 oder 3 oder 4 annimmt. Sonst wäre es ja eine normale Funktion. Richtig?

__________
edit:
Oh ja, Mensch, das kann ich dir selbst beantworten, das geht hervor aus dem Skript, ein paar Seiten später. Tatsächlich gibt es nur ganze Zahlen als Werte.
Einloggen um zu antworten.
Userbild von Mensch
mensch
am 11.01.06
Das x mit dem Strich drüber ist das arithmetische Mittel, das s~² ist die Varianz.

Das Mittel berechnet man mit
(Wert1 * Häufigkeit1 + Wert2 * Häufigkeit2 + ....) / n

n ist die Anzahl der Beobachtungen, also 100.

Das sieht dann so aus:

(20*1+30*2+30*3+20*4)/100 = 250/100 = 2,5 = arithmetisches Mittel.

Die Varianz berechnet man mit
[(Wert1 - arithmetisches Mittel)² + (Wert2 - arithmetisches Mittel)² + ...] / n

Also:

[(1-2,5)²+(2-2,5)²+(3-2,5)²+(4-2,5)²] = 5

Richtig?
Einloggen um zu antworten.
Userbild von sylvia
sylvia
am 11.01.06
hey mensch :-))

deine aktion find ich richtig gut. das kann ich nur unterstützen :Respekt:

daher hier ein paar wenige kommentare zu deinen bisherigen lösungen. bis 2.1.b) ist da aber fast nix zu sagen, weil nahezu perfekt :klatschen:
nur ganz kurz:

Zitat:



1.1.

b)

Merkmal Ausprägung zB Skalenniveau
...

mit "ausprägung" ist nicht die eigenschaft stetig/diskret gemeint (da stimmen deine antworten aber auch :-)), sondern die menge aller möglichen ausprägungen, also bei haushaltsgröße z.b. alle reellen zahlen, bei entfernung alle rationalen zahlen usw.

Zitat:



Ich glaube, das mit x zwischen 1 und 2 und so weiter ist hier zweifelhaft, weil x wahrscheinlich ausschließlich die Werte 1 oder 2 oder 3 oder 4 annimmt. Sonst wäre es ja eine normale Funktion. Richtig?

richtig. also quasi:
f(1)=0,2
f(2)=0,3
f(3)=0,3
f(4)=0,2
und für alles dazwischen relative häufigkeit=0
das ist aber nicht prinzipiell so, dass ein merkmal nur ganze zahlen als ausprägung haben kann, hängt ja von dem merkmal ab. nur in unserem beispiel erkennt man das an der empirischen verteilungsfunktion.

Zitat:



Die Varianz berechnet man mit
[(Wert1 - arithmetisches Mittel)² + (Wert2 - arithmetisches Mittel)² + ...] / n

Also:

[(1-2,5)²+(2-2,5)²+(3-2,5)²+(4-2,5)²] = 5

Richtig?

leider diesmal nicht :-o
deine angegebene formel ist für die urliste (rohdaten), wir habens hier aber mit häufigkeitsdaten zu tun. du musst daher mit den relativen häufigkeiten gewichten (oder mit den absoluten, und am ende durch n teilen), also:

(1-2,5)2*0,2 + (2-2,5)2*0,3 + (3-2,5)2*0,3 + (4-2,5)2*0,2 = 1,05

alles andere wie gesagt :thumps up:
Einloggen um zu antworten.