Sådan læses output af SPSS K-midler

Klyngeanalyse er en statistisk teknik, der bruges til at arrangere sager i kategorier, så sagerne i hver kategori ligner hinanden og adskiller sig fra sager i andre kategorier. Hver kategori er en klynge. Samfundsvidenskabere bruger SPSS (Statistical Package for the Social Sciences) til at udføre klyngeanalyser. I K-Means-klynger udpeger forskeren antallet af klynger, der ønskes. K er antallet af klynger, som forskere angiver, at de ønsker. K-Means-klyngedannelse giver forskere mulighed for at samle meget store datasæt.

Analyser data

Trin 1

Klik på "Analyser" øverst på SPSS-skærmen. Vælg "Klassificer" i rullemenuen og "K-betyder klynge."

Trin 2

Vælg et eksempel på sager. I dialogboksen skal du klikke på "Variabler" og fremhæve de variabler, du ønsker at bruge i den indledende K-Means-analyse. Klik på venstre pil for at flytte variablerne i feltet. Angiv antallet af klynger, normalt 5 i et gennemsnitligt datasæt i størrelsen, i feltet "Antal klynger." Antallet af klynger skal være mere end to og ikke mere end antallet af sager. Klik på "Iterer og klassificer" i dialogboksen for at få klyngecentre. Klik på "Skriv endelig."

Inkluder hele datafilen til den endelige K-Means-analyse. Klik på "Analyser" øverst på SPSS-skærmen. Vælg "Klassificer" i rullemenuen og "K-betyder klynge." I dialogboksen skal du vælge "Variabler" og fremhæve de variabler, du vil bruge. Klik på venstre pil. Indstil antallet af klynger til 5 i feltet "Antal klynger." Klik på "Klassificer" i dialogboksen. Vælg "Læs indledende" for at få klyngecentrene fra prøven i trin 2. Klik på "Gem". Klik på "Klyngemedlemskab." Klik på "Fortsæt".

Læs output

Trin 1

Gennemgå den første tabel i output, mærket "Final Cluster Centers." Øverst på tabellen har tallene 1 til 5 over det, hvilket indikerer hver af de 5 klynger. Den venstre kolonne viser "REGR-faktor score" (Regression factor score eller hvor godt hver variabel forudsiger score) for hver af analyserne. Hvis du følger linjen ved siden af score 1 til analyse 1 til højre, giver den dig faktor score for hver klynge.

Trin 2

Læs den næste tabel i output med overskriften "Antal sager i hver klynge." Feltet til venstre viser klyngerne efter nummer 1 til 5. Følg klyngenummeret til højre, så finder du antallet af sager i klyngen.

Se på den sidste tabel i output, "Cluster membership", som viser, hvilke sager der er i hver klynge. Sagerne er angivet i venstre kolonne, og klyngenummeret findes i kolonnen længst til højre.