Hiyerarşik Küme Analizi – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri
Hiyerarşik Küme Analizi
İlk iki şehir bir kümeye yerleştirildikten sonra geriye 11 varlığımız kalıyor; yani 10 bağımsız şehrimiz ve iki şehirden oluşan bir kümemiz var. Hiyerarşik küme analizindeki bir sonraki adım, bu 11 varlığın yakınlıklarını (benzerliklerini) değerlendirir ve en benzer iki varlık birleştirilir. Böylece, iki şehirli küme başka bir şehirle birleştirilebilir veya iki bağımsız şehir kendi kümelerinde birleştirilebilir. Bu adımın sonunda 10 varlık vardır ve süreç, tüm şehirler tek bir kümenin parçası olana kadar adım adım tekrarlanır.
Kümeleme algoritması sayesinde, varlıklar ne kadar farklı olursa olsun, analizin sonunda eninde sonunda birbirlerine bağlanacaklar. Araştırmacıların işi, kaç tane “yararlı” küme olduğunu belirlemektir. Kümeleme analizinde herhangi bir sıfır hipotezi için istatistiksel bir test olmadığından, araştırmacıların, analiz süreci boyunca hem tablo halinde hem de görsel formlarda görüntülenen kümeleme modeli tarafından yönlendirilmesi gerekir; Analizdeki varlıklar.
Kümeleme süreci, her biri için çeşitli yöntem seçenekleri bulunan, biri uzaklık ve diğeri bağlantı olmak üzere iki ayrı türde hesaplamayı içeren, hesaplama açısından karmaşıktır; bunlar Meyers et al. (2013). Yakınlıklar mesafe ölçüleridir ve hiyerarşik küme analizinde bu tür birkaç mesafe ölçüsü mevcuttur (kare Öklid mesafesi, Öklid mesafesi, şehir bloğu veya Manhattan mesafesi, Chebyshev mesafesi, Minkowski mesafesi ve güç metrik mesafesi) .
Mesafe, her bir yöntem bu belirlemeyi biraz farklı yapsa da, tüm varlıklar arasındaki tüm karşılık gelen ölçüler arasındaki fark açısından değerlendirilir (örneğin, her bir çift arasındaki medyan hane geliri, nüfus yoğunluğu farkının hesaplanması).
Varlıkları kümeler halinde birbirine bağlamak için kullanılabilecek birkaç yöntem vardır; bunlar, aritmetik ortalamalı ağırlıksız ikili grup yöntemini (gruplar arası ortalama bağlantı olarak da adlandırılır), ortalama grup içi bağlantı yöntemini, en yakın komşu (tek bağlantı olarak da adlandırılır) yöntemini, en uzak komşuyu (ayrıca gruplar arası ortalama bağlantı olarak da adlandırılır) içerir. tam bağlantı) yöntemi, ağırlıksız çift-grup centroid yöntemi (genellikle centroid yöntemi olarak adlandırılır), ağırlıklı çift-grup centroid yöntemi (genellikle medyan yöntemi olarak adlandırılır) ve Ward’ın yöntemi vardır.
Farkları hesapladığımız ve değişkenler üzerinde diğer aritmetik işlemleri yaptığımız için, veri analizinden önce tüm değişkenlerin aynı metriğe ayarlanması istenir ve bunu yapmanın en uygun yolu değerleri z puanlarına dönüştürmektir. IBM SPSS’deki Hiyerarşik Kümeleme prosedürü, talep etmemiz halinde bu standardizasyonu gerçekleştirmek için yerleşik bir prosedüre sahiptir.
Kümeleme analizi Nedir
Cluster analizi nedir
Hiyerarşik olmayan kümeleme analizi
Kümeleme analizi örnekleri
Tam bağlantı kümeleme yöntemi
Kümeleme analizi yöntemleri
Veri Bilimi hiyerarşisi
Kümeleme Analizi makale
SAYISAL ÖRNEK
Bu örnek için, demografi 12 ABD şehri veri dosyasını kullanıyoruz. Şehrin adını içeren Şehir değişkenine ek olarak, veri dosyası her şehir için aşağıdaki nicel değişkenleri içerir:
yaş (ortanca ikamet yaşı), gelir (ortalama hane geliri bin dolar), house_price (bin dolar olarak ortalama müstakil ev fiyatı), kira (ortalama kira maliyeti), maliyet (yaşam maliyeti endeksi), African_Amer (yüzdesi) Bir şehirde ikamet eden Afrikalı-Amerikalılar), Latino_Amer (bir şehirde ikamet eden Latin-Amerikalıların yüzdesi), yoğunluk (nüfus yoğunluğu), daha yüksek derece (mezun veya profesyonel dereceli yüzde), hiç evlenmemiş (hiç evlenmemiş yüzde) , boşanmış (boşananların yüzdesi), yabancı kökenli (ABD dışında doğanların yüzdesi), aynı cinsiyetli (aynı cinsiyetten hanelerin yüzdesi), obezite (yetişkin obezite oranı) ve suçlular (kayıtlı seks suçlularının sayısı).
ANALİZ KURULUMU
Demografi 12 ABD şehri veri dosyasını açıyoruz ve ana menüden Analiz Et ➔ Sınıflandır ➔ Hiyerarşik Küme’yi seçiyoruz. Bu, gösterilen ana iletişim penceresini açar. Çıktımızda şehir isimlerini görebilmemiz için City’yi panel ile Label Case’lere taşıyoruz. Daha sonra diğer tüm değişkenleri Değişken(ler) paneline taşırız ve Küme altındaki Vakaların ve Görüntü altındaki İstatistikler ve Grafiklerin varsayılanlarını koruruz.
Yöntem düğmesinin seçilmesi, gösterilen Yöntem iletişim penceresini açar. Kümeleme yöntemlerinin ve uzaklık ölçülerinin çeşitli kombinasyonlarını (kümeleme çözümünü temsil etmek için hangisinin kullanılacağını belirlemek için) kullanarak hiyerarşik bir küme analizi gerçekleştirmek yaygın bir uygulamadır.
Nispeten cimri ve yorumlanabilir bir sonuç veren çözümlerden biri burada gösterilmektedir. Cluster Method için açılır menüden Ward’s method’u seçiyoruz ve Distance Measure için varsayılan Squared Euclidean Distance’ı seçiyoruz. Pencerenin Değerleri Dönüştür alanında, Standardize açılır menüsünden Z puanlarını seçiyoruz ve varsayılan By değişkenini koruyoruz. Devam’ı tıklatmak bizi ana iletişim penceresine döndürür.
İstatistikler penceresinde Aglomerasyon çizelgesini (kümeleme sürecinin ilerlemesini tablo şeklinde göstermek için) ve şehirler arasındaki ilk mesafeleri görmek için Yakınlık matrisini seçiyoruz. Ana iletişim penceresine dönmek için Devam’ı tıklayın.
Gösterilen Plots penceresinde, Tüm kümeler için Dendrogram ve bir Icicle grafiği seçiyoruz. Oryantasyon alanında, saçağı grafiğini en geleneksel biçiminde sunmak için Dikey’i seçiyoruz. Ana iletişim penceresine dönmek için Devam’ı tıklayın ve analizi gerçekleştirmek için Tamam’ı seçin.
ANALİZ ÇIKIŞI
Şehirler için Yakınlık Matrisi gösterilmektedir. Bunlar, her şehir çifti arasındaki kare Öklid uzaklıklarıdır ve en yakın iki şehir, ilk kümeleme adımında bir kümede birleştirilecektir. Daha büyük değerler daha büyük mesafelerin göstergesidir (dolayısıyla dipnot bunun gerçekten bir farklılık matrisi olduğunu gösterir). En küçük değere sahip şehir çifti (analizimizde değişkenlerle ölçülen en yakın iki şehir) Austin ve Phoenix’tir; kareleri Öklid uzaklığı 6.053’tür.
Kümeler için Aglomerasyon Zamanlamasını gösterir. Sezgisel olması gerekmeyen bir stenografi kullanarak kümeleme sürecini izler, ancak tablodaki en önemli bilgiler Katsayılar altında bulunur. Bu sütun, analizdeki her adımda kümelerin bağlandığı mesafeyi (Ward’ın yöntemiyle, küme içi karelerin toplamıdır) temsil eder.
Hesaplama açısından karmaşık olabilir, ancak Katsayıları nispeten basit ve öznel olarak yorumluyoruz: Adımlar (Aşamalar) boyunca katsayıların değerindeki daha büyük sıçramalar, aşırı basitleştirilmiş terimlerle, birleştirmenin oldukça “zorlanmış” olduğunu (göreceli kümeler) göstermektedir. birbirine benzemeyenler birleştirilir) ve nispeten büyük bir sıçramadan hemen önce düşen olarak kabul etmek istediğimiz çözümdeki kümelerin sayısını belirlemek isteyebiliriz.
Sonuçlarımızda, Aşama 9 ve Aşama 10 (114.548 – 88.046) arasında 26.502’lik bir sıçrama ve Aşama 10 ile Aşama 11 (165.000 – 114.548) arasında çok daha büyük bir 50.452’lik sıçramamız var. Analizdeki 12 şehir ile 12 şehrin tamamı 12. Aşamada tek bir kümede birleştirilecektir.
Katsayı değerlerindeki artışlara dayanarak (ve her aşamada hangi şehirlerin birbirine bağlandığına bakmadan), muhtemelen 11. Aşama’nın sonunda çözümü dışarıdan kabul etme olasılığı ile kabul etmeye meyilli olacağız gibi görünüyor.
Cluster analizi nedir Hiyerarşik olmayan kümeleme analizi Kümeleme Analizi makale Kümeleme analizi Nedir Kümeleme analizi örnekleri Kümeleme analizi yöntemleri Tam bağlantı kümeleme yöntemi Veri Bilimi hiyerarşisi