Menschs IchbestehdiePrüfung-Thread - Grundlagen der Statistik I und II - Seite 1 - Uniturm.de

StudentInnen in der Stadt

Menschs IchbestehdiePrüfung-Thread

mensch am 11.01.06 In einem Monat ist die Statistikprüfung, und für viele ist das einzige, was sie über Statistik wissen, das, dass die Wahrscheinlichkeit P(X="Prüfung bestehen") so ungefähr bei = 0 liegt. Also: Für all diejenigen, denen für die Übungsaufgaben entweder die Lösung oder das Verständnis der Lösung fehlt soll es hier Beistand geben. Wenn ein paar Leute mal ein paar Seiten ihrer Mitschriften scannen, und wenn jeder, der schon ein bisschen Ahnung hat, hier mithilft um sein eigenes Verstehen zu vertiefen, dann kann es dieses Mal vielleicht einen statistischen "Ausreißer" geben, weil mehr Prüfungen bestanden werden als sonst. Ich fange mal mit der ersten Aufgabe an. Weil ich, und das vielleicht nicht als einziger, nicht bei der Übung war, kann manches folgende falsch sein und gern korrigiert werden. 1.1. a) Grundgesamtheit: Mitarbeiter und Mitarbeiterinnen einer Arbeitsstätte Untersuchungseinheiten: Haushälte von 50 Mitarbeitern b) Merkmal Ausprägung zB Skalenniveau ---------------------------------------------------------------------------------------- Haushaltsgröße \| diskret \| 5 (Personen) \| verhältnis monatliche Miete \| (quasi)-stetig \| 500,23 (Euro) \| verhältnis Beförderungsmittel \| diskret \| 1 = Bus, 2 = Bahn \| nominal Entfernung \| (quasi)-stetig \| 50,32 (km) \| verhältnis wirtschaftl.Lage \| diskret \| 1= sehr gut \| ordinal c) Studientyp: Querschnittsdaten Einloggen um zu antworten.
mensch am 11.01.06 2.1. a) die relativen Häufigkeiten errechnen sich aus Absolute Häufigkeit / n n = Gesamtanzahl aller Haushälte = bei Haushaltsgröße 1: 380131 / 722681 = 0,53 = bei Haushaltsgröße 2: 182838 / 722681 = 0,25 entspricht 25% usw. Absolute Häufigkeiten sind Anzahlen, relative Häufigkeiten sowas wie Prozente. Das Säulendiagramm zeichnet man wie im Skript auf Seite 58. Auf der x-Achse liegen also 1, 2, 3, 4, 5 (Haushaltsgröße) und an der y-Achse stehen die relativen Häufigkeiten, eingeteilt zB. in 0, 0.2, 0.4, 0.6, 0.8, 1. b ) Und das geht so: Summe aus Haushaltsgröße * Anzahl der Haushälte 1380131 + 2182838 + 387444 + 452033 + 5*20235 1Personenhaushaltspersonen: 380131 2Personenhaushaltspersonen: 365676 3Personenhaushaltspersonen: 262332 4Personenhaushaltspersonen: 208132 5Personenhaushaltspersonen: 101175 Gesamtpersonen: alles addiert = 1.317.446 Personen So, und jetzt die Fragestellung 380131 / 1317446 = 0.289 entspricht knapp 29 Prozent < 50 Prozent. Wir können dieser Aussage also nicht zustimmen. Einloggen um zu antworten.
mensch am 11.01.06 Und nun, obwohl es langsam schwieriger wird, hier die Aufgabe 2.2.) a) Und da hat man eine empirische Verteilungsfunktion gegeben. Aus dem Skript geht für mich hervor, dass man eine solche Grafik so liest: Welche Werte kommen wie oft vor? Das ist die Frage. n = 100, es gibt also hundert Beobachtungen. Die Werte sind geordnet und stehen auf der x-Achse. x kann also hier die Werte 1 bis 4 annehmen. Die Häufigkeiten stehen wieder an der y-Achse, und wenn man zum Beispiel bei x=1 schaut, dann sieht man einen Strich in Höhe y=0.2 bis hin zu x=2. Das heisst: 20% der Werte sind kleiner gleich 1. Das heisst ausserdem, (0.5-0.2) 30% der Werte sind zwischen 1 und 2, insgesamt liegt der Strich also bei y=0,5. Weiter gehts, und dann haben insgesamt schon 80% der Beobachtungen einen Wert kleiner gleich 3, und hundert Prozent haben einen Wert von kleiner gleich 4. Nochmal in Kurzform x <= 1 in 20 % 1 < x <= 2 in 30 % 2 < x <= 3 in 30 % 3 < x <= 4 in 20 % Das ist dann wohl die relative Häufigkeitsverteilung. Die absolute Häufigkeit ist hier sehr einfach auszurechnen, weil es ja 100 Beobachtungen gibt, streicht man also die Prozente hier weg, hat man die absoluten Zahlen. __________ edit: Ich glaube, das mit x zwischen 1 und 2 und so weiter ist hier zweifelhaft, weil x wahrscheinlich ausschließlich die Werte 1 oder 2 oder 3 oder 4 annimmt. Sonst wäre es ja eine normale Funktion. Richtig? __________ edit: Oh ja, Mensch, das kann ich dir selbst beantworten, das geht hervor aus dem Skript, ein paar Seiten später. Tatsächlich gibt es nur ganze Zahlen als Werte. Einloggen um zu antworten.
mensch am 11.01.06 Das x mit dem Strich drüber ist das arithmetische Mittel, das s~² ist die Varianz. Das Mittel berechnet man mit (Wert1 * Häufigkeit1 + Wert2 * Häufigkeit2 + ....) / n n ist die Anzahl der Beobachtungen, also 100. Das sieht dann so aus: (201+302+303+204)/100 = 250/100 = 2,5 = arithmetisches Mittel. Die Varianz berechnet man mit [(Wert1 - arithmetisches Mittel)² + (Wert2 - arithmetisches Mittel)² + ...] / n Also: [(1-2,5)²+(2-2,5)²+(3-2,5)²+(4-2,5)²] = 5 Richtig? Einloggen um zu antworten.
sylvia am 11.01.06 hey mensch ) deine aktion find ich richtig gut. das kann ich nur unterstützen daher hier ein paar wenige kommentare zu deinen bisherigen lösungen. bis 2.1.b) ist da aber fast nix zu sagen, weil nahezu perfekt nur ganz kurz: Zitat: 1.1. b) Merkmal Ausprägung zB Skalenniveau ... mit "ausprägung" ist nicht die eigenschaft stetig/diskret gemeint (da stimmen deine antworten aber auch , sondern die menge aller möglichen ausprägungen, also bei haushaltsgröße z.b. alle reellen zahlen, bei entfernung alle rationalen zahlen usw. Zitat: Ich glaube, das mit x zwischen 1 und 2 und so weiter ist hier zweifelhaft, weil x wahrscheinlich ausschließlich die Werte 1 oder 2 oder 3 oder 4 annimmt. Sonst wäre es ja eine normale Funktion. Richtig? richtig. also quasi: f(1)=0,2 f(2)=0,3 f(3)=0,3 f(4)=0,2 und für alles dazwischen relative häufigkeit=0 das ist aber nicht prinzipiell so, dass ein merkmal nur ganze zahlen als ausprägung haben kann, hängt ja von dem merkmal ab. nur in unserem beispiel erkennt man das an der empirischen verteilungsfunktion. Zitat: Die Varianz berechnet man mit [(Wert1 - arithmetisches Mittel)² + (Wert2 - arithmetisches Mittel)² + ...] / n Also: [(1-2,5)²+(2-2,5)²+(3-2,5)²+(4-2,5)²] = 5 Richtig? leider diesmal nicht deine angegebene formel ist für die urliste (rohdaten), wir habens hier aber mit häufigkeitsdaten zu tun. du musst daher mit den relativen häufigkeiten gewichten (oder mit den absoluten, und am ende durch n teilen), also: (1-2,5)²0,2 + (2-2,5)²0,3 + (3-2,5)²0,3 + (4-2,5)²0,2 = 1,05 alles andere wie gesagt Einloggen um zu antworten.