MAHALANOBİS UZAKLIĞI – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri
MAHALANOBİS UZAKLIĞI
ANALİZ KURULUMU: LİNEER REGRESYON
GAF cinsiyet yaşı adlı IBM SPSS® kaydetme dosyasını açın ve ana menüden, Şekil 19.1’de gösterilen ana Lineer Regresyon iletişim penceresini oluşturan Analyze ➔ Regression ➔ Linear öğesini seçin. Cinsiyet, GAF ve yaşı Bağımsız(lar) paneline taşıdık. Mahalanobis uzaklığı hesaplamalarının sonuçları yalnızca Bağımsız(lar) panelindeki üç değişkene dayanmaktadır.
Doğrusal Regresyon prosedürü, tam regresyon analizini gerçekleştirmek için bir Bağımlı değişken gerektirdiğinden (bizim ilgimiz yalnızca Mahalanobis mesafelerinin karesini elde etmek olsa da), bağımlı değişken olarak keyfi olarak id’yi belirledik ve onu Bağımlı panele taşıdık; bu tam regresyon analizindeki (id) bağımlı değişken konu dışıdır ve ana çoklu regresyon sonuçları anlamsızdır ve göz ardı edilmelidir.
Kaydet düğmesine tıklamak, Mesafeler panelinde Mahalanobis onay kutusunu etkinleştirdiğimiz Kaydet iletişim penceresini açar. Bu belirtim, veri dosyasında her bir durum için kareli Mahalanobis mesafesi ile doldurulacak yeni bir değişken yaratacaktır. Ana iletişim penceresine dönmek için Devam’a tıklayın ve analizi gerçekleştirmek için Tamam’a tıklayın.
ANALİZ ÇIKTI: LİNEER REGRESYON
Odak noktamız yalnızca veri dosyasının sonunda görünen yeni değişken üzerindedir ve anlamsız regresyon sonuçlarını görmezden geleceğiz. Yeni değişkene MAH_1 adı verilir (genel olarak IBM SPSS tarafından analiz oturumumuzdaki ilk kaydedilen Mahalanobis mesafeleri kümesi olarak adlandırılır). Her durum için Mahalanobis uzaklığının karesini temsil eder. Örneğin, veri dosyasındaki ilk vakanın MAH_1 değeri 2.51111’dir.
SONUÇLARI İNCELEME STRATEJİLERİ
Varsa hangi durumların çok değişkenli aykırı değerler olduğunu belirlemek için, analiz kurulumunda Bağımsız(lar) paneline tıkladığımız değişken sayısına eşit serbestlik dereceli ki-kare dağılımına karşı bu kareli Mahalanobis uzaklık değerlerini değerlendiririz. (mevcut örnekte üç değişken). Bu nedenle, Tablo A.1’de gösterilen ki-kare için Kritik Değerler Tablosuna başvuruyoruz ve p = .001 olan katı alfa seviyesini kullanıyoruz. Üç değişkenli mevcut örnekte, üç serbestlik derecesine sahibiz. df = 3 için tabloya bakılarak, Mahalanobis uzaklık değerinin karesi 16.266’ya eşit veya daha büyük olan herhangi bir durum çok değişkenli aykırı değer olarak kabul edilebilir.
Mahalanobis mesafelerinin karesinin ki-kare değerlendirmesine dayalı olarak hangi durumların çok değişkenli aykırı değerler olarak kabul edilebileceğini belirlemenin alternatif yolları vardır. IBM SPSS Explore yordamı bir alternatiftir, ancak bir değişkenin yalnızca en yüksek (ve en düşük) beş değerini sağlar. Büyük veri dosyalarıyla veya birkaç aykırı değere sahip veri dosyaları olması durumunda, Keşfet çıktısındaki kritik Mahalanobis mesafe değerimizin ötesindeki tüm değerleri elde edemeyebiliriz.
Kare Mahalanobis uzaklık değerleri sıfırın altına düşemez; bu nedenle, dağılımın sadece üst ucunu incelemekle ilgileniyoruz. Soruşturmamızın bu asimetrik doğası göz önüne alındığında, tüm aykırı değerleri tanımlamanın uygun bir alternatif yolu var. Vakaları yeni MAH_1 değişkenine göre azalan bir düzende Sıralayabiliriz; bu, en yüksek kareli Mahalanobis uzaklık değerlerini veri dosyasının en üstüne yerleştirecek ve veri dosyasını Veri Görünümünde görüntüleyerek bunları görmemize izin verecektir.
Mahalanobis uzaklığı formülü
Mahalanobis uzaklığı
Ki-kare Tablosu
Aykırı değer Tespiti
Çok değişkenli uç değer
Çok değişkenli uç değerlerin incelenmesi
Mahalanobis uzaklığı SPSS
Mahalanobis çok değişkenli uç değer
VERİLERİN İNCELENMESİ
Ana menüden Veri ➔ Vakaları Sırala’yı seçin, MAH_1’i Sıralama ölçütü paneline taşıyın, en yüksek değeri elektronik tablonun en üstüne yerleştirmek için Azalan’ı seçin (Şekil 19.4’te gösterilmektedir) ve Tamam’a tıklayın. Tamamlanan sıralama, Şekil 19.5’teki veri dosyasının Veri Görüntüleme modunda görülebilir, burada sadece bir vakanın MAH_1 değerinin kritik değerimiz olan 16.266’yı aştığı görülebilir. Bu bir vaka, MAH_1 değeri 17.99652 olan ID # 20’dir.
ID # 20 için sıraya bakmak bize bu vakanın neden aykırı değer olabileceğine dair bir fikir verir – bu müşteri kadındı (1 cinsiyet kodu), 21 yaşında (muhtemelen veri setindeki en genç vakalardan biri) ve 90 GAF puanına sahipti (çok yüksek düzeyde işleyen birini düşündürür). Bu iki nicel puanın ilgili tek değişkenli ortalamalarından ne kadar uzak olduğunu görmek için, Bölüm 13’te açıklandığı gibi yaş ve GAF puanlarını standartlaştırabiliriz. Kısaca, Tanımlayıcı İstatistikler ➔ Tanımlayıcılar’ı seçiyoruz, GAF ve yaşı Değişken(ler) paneline taşıyoruz, Standartlaştırılmış değerleri değişken olarak kaydet (Şekil 19.6’da gösterilmiştir) kutusunu işaretleyin ve Tamam’a tıklayın.
İki değişken için varsayılan tanımlayıcı istatistikler Şekil 19.7’de gösterilmektedir. GAF ortalaması 11.052 standart sapma ile 49.43 iken, yaş ortalaması 6.786 standart sapma ile 29.95’tir. Bu nedenle, ID # 20’nin GAF puanı, ortalamadan üç standart sapma biriminden daha yüksektir ve ID # 20’nin yaşı, ortalamadan bir standart sapma biriminden daha düşüktür.
Bu uç puanlar, sıralanmış veri dosyamızda ID No. 20’nin hala ilk satırda olduğu Şekil 19.8’de çok açık ve kesin olarak görülebilir. Artık 90 GAF puanının ortalamadan 3.67088 standart sapma birimi yüksek olduğunu ve yaşının (z = -1,31930) ortalamanın 1.31930 standart sapma birimi altında olduğunu kolayca görebiliriz. Bu kombinasyon (ve cinsiyeti değil, çünkü neredeyse eşit sayıda kadın ve erkek var), çok yüksek bir GAF puanı ve biraz ama aşırı olmayan bir şekilde genç yaşta çok değişkenli bir aykırı değer üretti. Araştırma bağlamına bağlı olarak, bu vaka sonraki veri analizinin dışında tutulabilir veya dışlanmayabilir.
Dağılım Şeklinin Değerlendirilmesi: Normallik, Çarpıklık ve Basıklık
Normal dağılım, bir değişkenin her değerindeki göreceli oluşum sayısını temsil eden bir frekans dağılımıdır. Dağılımın şekli bir zili andırır ve bu nedenle takma adını çan şeklindeki eğri olarak alır. Normal dağılımı çizdik.
Bu bölümde ele alınan birçok istatistiksel prosedür, bağımlı değişken üzerindeki puanlarla ilişkili hataların normal dağıldığını varsaymaktadır, bu varsayım karşılandığında, puanların dağılımı da normal dağılma eğilimindedir. Araştırmamızda kullandığımız nicel (metrik) değişkenlerin çoğu (örn. yaş, kilo, kan basıncı, aylık gelir) bu ideale yakındır.
Normal dağılımlar, aşağıdakiler de dahil olmak üzere çeşitli özelliklere sahiptir:
• Normal dağılım, dağılım ortalaması etrafında yatay olarak simetriktir (her bir taraf diğer tarafın ayna görüntüsüdür).
• Ortadaki değer, dağılımın ortalamasını, medyanı ve modunu temsil eder.
• Standart sapma, ortalama ile eğrinin yan tarafındaki bükülme noktası (eğim yönünün değişmesi) arasındaki mesafedir.
• Standartsapmaölçümünaralık düzeyidir.Bir standart sapmanın mesafesini bilmek, X ekseninin geri kalanını doldurmamızı sağlar. sayısı
Ortalamadan uzaklık açısından standart sapma birimleri bir z puanı ölçeğidir.
• Ortalamanın z puanı sıfırdır.
•±1.00 standart sapma birimi arasında, alanın (veya puanların) yaklaşık olarak %68.26’sı vardır; bu aralık, yaklaşık 16-84 yüzdelik puanlara karşılık gelir.
• ±1.96 standart sapma birimi arasında, alanın yaklaşık %95’i vardır; bu aralık yaklaşık 2.5–97.5 arasındaki yüzdelik puanlara karşılık gelir.
• ±3.00 standart sapma birimi arasında, alanın yaklaşık %99’u vardır; bu aralık, yaklaşık 0.1-99.9’luk yüzdelik puanlara karşılık gelir.
• Ortalamadan uzaklık arttıkça, eğri yaklaşır ama asla X eksenine ulaşmaz.
Aykırı değer Tespiti Çok değişkenli uç değer Çok değişkenli uç değerlerin incelenmesi Ki-kare Tablosu Mahalanobis çok değişkenli uç değer Mahalanobis uzaklığı Mahalanobis uzaklığı formülü Mahalanobis uzaklığı SPSS