StudentInnen in der Stadt
HILFE Abwl, Marketing II Clusteranalyse, wieviele Cluster? |
---|
bibi blocksberg
am 30.01.08
Halli Hallo, wir brauchen da mal hilfe bei der entscheidung wieviele cluster man in den b) aufgaben wählt und wie man seine entscheidung begründet. ALSO: wir haben mitbekommen, dass man das graphisch lösen kann und nach dem elbow-kriterium (größter knick, größter sprung) entscheiden kann...schönchen. AUßERDEM: kann man den "Sprung" ja auch mittels Subtraktion der beiden ausgerechneten euklid. Distanzen der verschiedenen Durchgänge errechnen um dann bei der größten Differenz einen waagerechten strich durch das dendrogramm zu ziehen und sich dann so zu entscheiden... PROBLEM: bei der aufgabe SoSe 04 bekommt man bei den beiden methoden einmal 2 cluster, einmal 4 cluster raus...wieviele cluster würdet ihr da nehmen??? und warum??? DANKE für eure Zeit §-)
Einloggen um zu antworten.
|
lucy_ba
am 30.01.08
hallo, Optimale Cluster-Anzahl = 2 und zwar Cluster {1234} {5} ermittlung am besten über Elbow-Kriterium ...
Einloggen um zu antworten.
|
allanin
am 30.01.08
nun möchte der prof. ja gern eine begründung...wer kann die denn sinnvoll mit dem elbow-kriterium liefern? das hinmalen eines weiteren diagrams, oder der kleinen wertetabellen kann wohl kaum ausreichend sein, oder? danke allanin
Einloggen um zu antworten.
|
hanna
am 31.01.08
Mein Problem mit dem elbow-Kriterium ist, dass dieser Graph bei mir auch mal zwei Knicke aufweist, und ich dann eben nicht mehr weiß, welche der beiden Lösungsmöglichkeiten, denn nun richtig ist. Außerdem, woher weiß ich denn in der Graphik, wie sich die Cluster zusammensetzen??? Übrigens: die beiden Methoden (elbow, densrogramm) unterscheiden sich bei der Aufgabe SS 07 oder hab ich da was falsch berechnet???
Einloggen um zu antworten.
|
lucy_ba
am 31.01.08
@ Hanna der größere Knick ist ausschlag gebend, man muss den Graphen im 1:1 Maßstab zeichnen sonst wird es schwierig den größeren Knick zu erkennen. X-Achse Cluster Anzahl und Y-Achse die Abstände Die Cluster musst du vorher bestimmen über die Distanzen, da diese die Grundlage für den Graphen sind.
Einloggen um zu antworten.
|
philipp
am 31.01.08
ist der knick lt elbow-kriterium nicht immer bei drei - d.h. aufgrund unserer wenigen werte (in unserem diagramm ja nur drei) ist die optimale clusterlösung stets bei drei clustern oder nich - ich glaub schon?!
Einloggen um zu antworten.
|
lucy_ba
am 31.01.08
nein nicht immer auch mal bei 2 (zBsp. SS04 oder WS 05/06)
Einloggen um zu antworten.
|
philipp
am 31.01.08
@luca_ba kannst du kurz erklären wie du bei der ss2004 eine optimale clusterlösung von 2 herausbekommst? bei mir liegen die drei punkte so ziemlich auf einer geraden, d.h. ich kann da keinen knick ausmachen! distanz 3,5 - cluster 12 distanz 5 - cluster 34 d 6,3 - cluster 1234 d 6,5 .ckuster 12345 die stimmen doch so oder?!
Einloggen um zu antworten.
|
philipp
am 01.02.08
@lucy_ba bitte noch mal kurze erklärung deiner clusterlösung von 2 mittels elbow-krit. danke
Einloggen um zu antworten.
|
lucy_ba
am 01.02.08
@Phlipp deine Werte simmen distanz 3,5 - cluster 12 distanz 5 - cluster 34 d 6,3 - cluster 1234 d 6,5 .ckuster 12345 wenn du das jetzt in ein Diagramm einzeichnest Y-Achse die Distanzen X-Achse die Clusteranzahl vom Ursprung 0 aufsteigend dort zeichnest du die punkte [red]maßstabgetreu!!! [/red] ein also für Clusteranzahl: 1 Distanz: 6,5 Clusteranzahl: 2 Distanz 6,3 Clusteranzahl:3 Distanz: 5 CA: 4 D:3,5 dann punkte miteinander verbinden und du siehst das bei CA 2 ein knick ist.... hoffe ich konnte helfen, wenn nicht schreib mir
Einloggen um zu antworten.
|