k-Ortalamalar Kümeleme Analizi

Hiyerarşik Küme

Hiyerarşik küme analizinin klasik çıktısı, sunulduğu şekliyle dikey saçağı grafiğidir. Adını bir evin çatısında oluşan buz sarkıtlarının görüntüsünden alır ve aşağıdan yukarıya doğru okunur. Yukarıdan (analiz tamamlandı) aşağıya (11 küme belirlendi) tam (koyu) dikey çubuk her şehri temsil eder. Örneğin, 11 kümelik adımda (dikey çubukların arsanın altında başladığı konum), 10 bağımsız şehrimiz ve iki şehrin birbirine bağlandığı bir kümemiz var.

İlk katılımın Austin ve Phoenix arasında olduğunu Proximity Matrix’ten biliyoruz. Austin ve Phoenix’in bitişik çubukları işgal ettiğini unutmayın, çünkü IBM SPSS, bu şehirlerin buz saçağı grafiğinin üst kısmına hizalamak için sırayla nasıl bağlanacağına dair bilgileri kullandı. Ayrıca, katılımlarını belirtmek için bu iki şehir arasında 11 küme işaretine kadar dikey bir çubuk çizildiğini unutmayın.

10 küme konumuna doğru ilerlediğimizde Los Angeles ve Chicago’nun bağlantılı olduğunu görüyoruz. Böylece, sekiz bağımsız şehrimiz ve her biri iki şehir içeren iki kümemiz var. Dokuz küme konumuna tekrar bir basamak yükselerek, Seattle ve Atlanta’nın birleştiğini görüyoruz.

Saçağı grafiğindeki ışık aralığı, kümeleri büyüdükçe ayırt etmemize yardımcı olur. En üst sıraya ulaşmadan hemen önce, Aglomerasyon Çizelgesi’nin Katsayılar sütununda dikkatimizi çeken katsayı değerlerindeki sıçramayı ayırt edebiliyoruz. Bize iki ana küme sunuyor gibi görünüyor. Bir küme (arsanın en sağında) Seattle, Atlanta, San Francisco, Boston ve New York’u içeriyor gibi görünüyor; diğeri kalan şehirleri içerir.

Bir sonraki en düşük konumu incelemek, Aglomerasyon Çizelgesi’nde vurguladığımız alternatif ve daha az çekici çözümü ayırt etmemizi sağlar. Burada, üç kümeden oluşan bir kümemiz var gibi görünüyor. Yine Seattle, Atlanta, San Francisco, Boston ve New York kümelerden birini temsil ediyor. Başka bir küme, arsanın en solunda görünüyor ve Memphis ve Jacksonville’den oluşuyor. Üçüncü küme, arsada bu ikisi arasında yer alır ve Miami, Austin, Phoenix, Los Angeles ve Chicago’dan oluşur.

Kümeleme sürecini görüntülemenin alternatif bir yolu, gösterilen Dendrogram grafiğidir. Bu diyagramda üç kümeli çözümü ayırt etmek biraz daha zor olabilir, ancak iki kümeli çözüm, neredeyse en sağdaki yatay çizgi çiftiyle işaret edilerek çarpıcı bir şekilde öne çıkıyor. Icicle ve Dendrogram grafikleriyle birlikte Aglomerasyon Programının sonuçları göz önüne alındığında, iki kümeli çözümün incelenen şehirler arasındaki benzerlikleri en iyi şekilde karakterize ettiği sonucuna varabiliriz.

k-means algoritması özellikleri
k-means kümeleme analizi spss
k-means kümeleme örnek
K-means örnek soru
K-means clustering Python
k-means algoritması kodu
k-means algoritması adımları
K-means clustering in R

Bölüm 59’da tartışılan hiyerarşik kümeleme genellikle birkaç değişken temelinde nispeten az sayıda varlığı gruplamak için kullanılırken, k-ortalamalar kümeleme, küçük bir değişken alt kümesine dayalı olarak nispeten çok sayıda varlıktan küçük bir grup veya küme oluşturmak için kullanılır. . Hiyerarşik kümeleme için doğru olduğu gibi, değişkenler analizin başlangıcında z skoru biçiminde olmalıdır; ancak bu, IBM SPSS®’nin Tanımlayıcılar yordamında k-araç kümelemesi için önceden yapılmalıdır. k-ortalama kümeleme prosedürü için kullanılan algoritma J. MacQueen (1967) tarafından adlandırılmıştır, ancak algoritmanın şu anda çoğu yazılım programı tarafından kullanılan versiyonu Hartigan ve Wong (1979) tarafından ileri sürülmüştür.

k-ortalamalar prosedürü, araştırmacıların oluşturmak istedikleri küme sayısını belirtmesiyle başlar; k cinsinden k, kümelerin sayısıdır. Başlangıçta “en iyi” (en yorumlanabilir, en mantıklı, en çekici) çözümü bilmediğimiz için, araştırmacılar hemen hemen her zaman küçük bir çözüm aralığı (örneğin üç ila beş küme) üretmek için bir dizi analiz gerçekleştirir; daha sonra ihtiyaçları için en uygun olanı seçeceklerdir.

K-ortalama analizi yinelemeli bir süreçtir. Analizdeki ilk adım, kümeleme değişkenleri üzerinde oldukça farklı değerlere sahip (birbirinden uzak) veri dosyasındaki k vakanın belirlenmesidir. Bu durumlar başlangıç noktaları veya ilk küme merkezleri olarak hizmet edecektir (aksi takdirde tohum noktaları olarak seçilmek ve dolayısıyla sonuçları çarpıtmak için güçlü adaylar olduklarından aykırı değerler taranmış olmalıdır).

Bu ilk aşamada, kümeler, en yakın olduğu kümeye atanan bir vaka ile oluşturulur. Değiştirilmiş bir centroid yöntemi, kümenin merkezi veya merkezi (kümeleme değişkenlerinin ortalaması) ile kümelenmemiş varlıklar arasındaki Öklid mesafesini kullanır. En küçük mesafe, hangi varlığın hangi kümeye atanacağını belirler.

Tüm durumlara küme üyeliği atandığında, kümenin merkezi (merkezi) belirlenir. Bu centroid, basitçe, kümeleme sürecinde kullanılan değişkenlere dayalı olarak kümeye atanan durumların çok değişkenli ortalamasıdır. Bu merkezler yeni çekirdek noktaların rolünü üstlenir, vakalar önceki küme atamalarından “serbest bırakılır” ve prosedürün başlangıcında yapılana benzer bir yeniden atama aşaması başlatılır. Tüm durumlar yeni kümelere yeniden atandıktan sonra, bu yeniden yapılandırmaya dayalı merkezler hesaplanır.

Ardından IBM SPSS, kümeler arasındaki mesafede meydana gelen en büyük değişikliği belirler. Bu değişiklik önceden belirlenmiş bir eşikten büyükse, mevcut küme merkezlerini başka bir yeniden sınıflandırma aşamasının ilk merkezleri (tohum noktaları) olarak kullanarak yeniden başlar (yinelenir). Yineleme, mesafedeki değişiklik ölçüt eşiğine ulaşana veya IBM SPSS, araştırmacılar tarafından belirtilen yineleme sayısına ulaşana kadar devam eder. Küme üyeliği veri dosyasına kaydedilebilir ve daha sonra sonraki analizlerde kategorik gruplama değişkeni olarak kullanılabilir.

SAYISAL ÖRNEK: k -KÜMELEME ARAÇLARI

Bu örnek için 425 vaka ile kişilik veri dosyasını kullanıyoruz. Vakaları üç değişkene göre gruplandıracağız: neoconsc (vicdanlılık), negafect (sıkıntı, düşmanlık ve korku yanıtlayıcısının yakın zamanda yaşadığını bildirdiği olumsuz etki miktarı) ve saygı (bir özsaygı ölçüsü) .

ANALİZ STRATEJİSİ

İlk önce, Tanımlayıcılar prosedüründe üç kümeleme değişkeninin bir z puanı dönüşümünü gerçekleştiriyoruz. Daha sonra bu dönüştürülmüş değişkenleri bir k-ortalama prosedüründe kullanırız. Örnekleme amacıyla, üç kümeli bir çözüm mantıksız olmasa da, uygulanabilir ve yorumlanabilir bir çözüm sunduğuna inandığımız için dört kümeli çözümü elde ederiz.

Son olarak, daha sonraki (ve çok basit) bir analizde küme değişkeninin kullanımını göstermek için denekler arası tek yönlü ANOVA’da k-ortalama prosedürü tarafından oluşturulan grupları bağımsız bir değişken olarak kullanacağız.

akademidelisi2

Biyografinin Tamamını Gör

k-means algoritması adımları k-means algoritması kodu k-means algoritması özellikleri K-means clustering in R K-means clustering Python k-means kümeleme analizi spss k-means kümeleme örnek K-means örnek soru

Bir yanıt yazın Yanıtı iptal et

Türkiye (Turkey)

Almanya (Germany)

Bulgaristan (Bulgaria)

Danimarka (Denmark)

Kanada (Canada)

Malta (Malta)

KKTC (TRNC)

Yunanistan (Greece)

Amerika Birleşik Devletleri (USA)

Çin (China)

Japonya (Japan)

Birleşik Krallık (UK)

Fransa (France)

İspanya (Spain)

Norveç (Norway)

Belçika (Belgium)

Hollanda (Netherlands)

İsviçre (Switzerland)

İsveç (Sweden)

İtalya (Italy)

Finlandiya (Finland)

Meksika (Mexico)

Güney Kore (South Korea)

Rusya (Russia)

Hırvatistan (Croatia)

İrlanda (Ireland)

Polonya (Poland)

Hindistan (India)

Avustralya (Australia)

Brezilya (Brazil)

Arjantin (Argentina)

Güney Afrika (South Africa)

Singapur (Singapore)

Birleşik Arap Emirlikleri (UAE)

Suudi Arabistan (Saudi Arabia)

Portekiz (Portugal)

Avusturya (Austria)

Macaristan (Hungary)

Çek Cumhuriyeti (Czech Republic)

Romanya (Romania)

Tayland (Thailand)

Endonezya (Indonesia)

Ukrayna (Ukraine)

Kolombiya (Colombia)

Şili (Chile)

Peru (Peru)

Venezuela (Venezuela)

Kosta Rika (Costa Rica)

Panama (Panama)

Küba (Cuba)

Dominik Cumhuriyeti (Dominican Republic)

Jamaika (Jamaica)

Bahamalar (Bahamas)

Filipinler (Philippines)

Malezya (Malaysia)

Vietnam (Vietnam)

Pakistan (Pakistan)

Bangladeş (Bangladesh)

Nepal (Nepal)

Sri Lanka (Sri Lanka)

Ekvador (Ecuador)

Yeni Zelanda (New Zealand)

Litvanya (Lithuania)

Letonya (Latvia)

Estonya (Estonia)

Slovakya (Slovakia)

Slovenya (Slovenia)

Kenya (Kenya)

Tanzanya (Tanzania)

Mozambik (Mozambique)

Zambiya (Zambia)

Gana (Ghana)

Nijerya (Nigeria)

Senegal (Senegal)

Fas (Morocco)

Cezayir (Algeria)

Tunus (Tunisia)

Ürdün (Jordan)

İsrail (Israel)

Katar (Qatar)

Umman (Oman)

Kuveyt (Kuwait)

Kazakistan (Kazakhstan)

Özbekistan (Uzbekistan)

Türkmenistan (Turkmenistan)

Tacikistan (Tajikistan)

Ermenistan (Armenia)

Gürcistan (Georgia)

Azerbaycan (Azerbaijan)

Bosna-Hersek (Bosnia & Herzegovina)

k-Ortalamalar Kümeleme Analizi – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri