Veri Analizinde İlk Adımlar – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri
Aykırı Değerler ve Açıkça Yanlış Değerler
Eksik değerlere benzer bir sorun, açıkça yanlış değerlerdir. Standartlaştırılmış müşteri anketleri genellikle her ikisini de içerir. Bazen bir katılımcı, iş durumu sorulduğunda işsiz olarak işaretlenmiş kutuyu işaretler, ancak gelir sorulduğunda 1.000.000.000 € gibi tuhaf bir rakam girer. Bu yanıt 500 kişilik bir ankete dahil edilseydi, ortalama gelir 2.000.000 € artacaktı.
Bu nedenle, açıkça yanlış cevapların veri setinden çıkarılması gerekir. Burada, kasıtlı olarak yanlış olan gelir rakamı, eksik bir değer olarak işaretlenebilir veya açıklanan tekniklerden biri kullanılarak tahmini bir değer verilebilir.
Açıkçası yanlış değerler her zaman kasıtlı değildir. Ayrıca hatanın sonucu olabilirler. Örneğin, iş anketleri genellikle gelir rakamlarını binlerce avro olarak ister, ancak bazı katılımcılar her zaman mutlak değerler sağlar, böylece gelirleri gerçekte olduğundan bin kat daha yüksek gösterir. Keşfedilirse, bunun gibi hatalar veri analizinden önce düzeltilmelidir.
Daha zor bir durum, verilerin kasıtsız olarak yanlış olduğu ancak kolayca düzeltilemediği durumlardır. Örneğin, işletmelerden harcamalarının kategoriye ve yüzdeye göre dökümünü vermelerini istediğinizde, sıklıkla %100’den fazla toplam değerler alırsınız. Benzer hatalar özel şahıslarda da meydana gelir.
Diğer bir zor durum, değerin doğru ancak bir aykırı değer olduğu zamandır. Bir şirketin gelecekteki çalışan emekli maaşlarını hesaplamak istediğini varsayalım. Ortalama emeklilik yaşını bulmak için, işçilerin son yıllarda emekli oldukları yaşların ortalamasını alırlar. Şimdi, şirketin kurucusu olan yeni emeklilerden birinin işi 80 yaşında bıraktığını varsayalım.
Bu bilgi doğru olmasına ve kurucu emekli çalışanın hedef grubunun bir parçası olmasına rağmen, bu değerin dahil edilmesi, ortalama emeklilik yaşını çarpıtacaktır, çünkü diğer çalışanların da oyunda bu kadar geç emekli olmaları pek olası değildir. Bu nedenle, belirli koşullar altında aykırı değerleri analizden çıkarmak mantıklıdır tabii ki bağlamın bunu garanti etmesi şartıyla. Genel bir çözüm, en yüksek ve en düşük yüzde beşi ortadan kaldırarak veri kümesi değerlerini kırpmaktır.
Tek Değişkenli Veri Analizi
Veri Analizinde İlk Adımlar
Bir önceki bölümden öğrencilerimize dönelim. Ekmek çeşitleriyle ilgili anketlerini tamamladıktan sonra, 850 katılımcıdan gelen verileri kodladılar ve bir bilgisayara girdiler. Veri değerlendirmesinin ilk adımında, örneğin ortalama katılımcı yaşı gibi her bir değişkeni ayrı ayrı araştırırlar. Buna tek değişkenli analiz denir. Buna karşılık, araştırmacılar örneğin cinsiyet ve yayılma seçimi gibi iki değişken arasındaki ilişkiyi analiz ettiğinde buna iki değişkenli analiz denir. İkiden fazla değişken arasındaki ilişkilerde çok değişkenli analizden söz edilir.
850 yanıtın sonuçları, anket yapılan nitelikler ve bunların ilişkileri hakkında gerçekçi ve doğru bir izlenim yaratmak için nasıl “damıtılmış” olabilir? Burada istatistiğin önemi ortaya çıkıyor. Son final sınavının sonuçları sorulan profesörü hatırlayın.
Öğrenciler damıtılmış bilgi bekler, örn. “ortalama puan %75” veya “başarısızlık oranı %29.4” idi. Bu bilgilere dayanarak, öğrenciler genel performansı doğru bir şekilde değerlendirebileceklerine inanırlar: “ortalama %75 puan, son final sınavındaki %82 ortalamadan daha kötüdür”. Tek bir damıtılmış veri parçası – bu durumda, ortalama puan tüm sınıfın performansını özetlemek için yeterli görünmektedir.
Veri analiz yöntemleri PDF
Nicel veri analiz yöntemleri
Veri analizi örnekleri
Veri analizi Makale
SPSS veri analiz yöntemleri
Analiz yöntemleri
Veri analizi Nedir nasıl Yapılır
Verilerin Analizi Nedir
Bu bölüm ve sonraki bölüm, verilerin damıtılması yöntemlerini ve bunlara eşlik eden sorunları açıklayacaktır. Yukarıdaki anket baştan sona örnek olarak kullanılacaktır.
Nominal ve sıralı ölçekli değişkenlerin tek değişkenli dağılımına genel bir bakış oluşturmak için grafik temsiller veya sıklık tabloları kullanılabilir. Sıklık tablosunda, her değişken özelliği kendi satırını alır ve her satır mutlak frekans, göreli frekans [% olarak], 2 geçerli yüzde değeri ve kümülatif yüzde sütunlarıyla kesişir. xi özelliğinin göreli frekansı cebirsel olarak f(xi) ile kısaltılır. Eksik değerler, yüzde değeriyle ayrı bir satırda belirtilir.
Eksik değerler, geçerli yüzde değerleri ve kümülatif yüzde hesaplamalarına dahil edilmez. Kümülatif yüzde, söz konusu satır dahil tüm satırların toplamını yansıtır. Derecelendirme ortalaması için verilen %88.1 rakamı, ankete katılanların %88.1’inin seçimi ortalama veya daha kötü olarak tanımladığını göstermektedir. Cebirsel olarak, kümülatif frekanslar bir dağılım fonksiyonu olarak ifade edilir, F(x) olarak kısaltılır ve aşağıdaki gibi hesaplanır.
Bu sonuçlar aynı zamanda bir pasta grafik, yatay bir çubuk grafik veya bir dikey çubuk grafik olarak grafiksel olarak gösterilebilir. Pasta grafikler çoğunlukla nominal değişkenler için kullanılsa da, üç diyagram formunun tümü nominal ve sıra değişkenleriyle kullanılabilir.
Çubuk grafikteki sıklık tablosunun özellikleri (zayıf, orta, ortalama, iyi, mükemmel) x eksenine ve göreli veya mutlak frekans y eksenine atanır. Bir çubuğun yüksekliği, her x değerinin frekansına eşittir. Göreceli frekanslar y eksenine atanırsa, frekans fonksiyonunun bir grafiği elde edilir.
Sıklık tablosuna ek olarak, F(x) dağıtım fonksiyonunu kullanarak sıralı olarak ölçeklenmiş (veya daha yüksek) bir değişkenin dağılımını da gösterebiliriz. Bu işlev, söz konusu x değişkenlerinin özelliklerini x ekseninde bırakır ve kümülatif yüzdeleri y eksenine atar ve bir adım işlevi oluşturur. Veri gösterimi, frekans tablosundaki kümülatif yüzdeleri olan sütuna benzer.
Birçok yayında, dikey çubuk grafiğin y eksenindeki ölçeklendirme 0 ile değil, rastgele bir değerle başlar. Gösterdiği gibi, bu ilk bakışta bir yanlış anlamaya yol açabilir. Her iki grafik de aynı içeriği temsil etmektedir erkek ve kadın katılımcıların göreceli sıklığı (sırasıyla %49 ve %51) vardır.
Ancak ilk grafikte y ekseni kesildiği için cinsiyetlerin göreli sıklığı değişiyor gibi görünüyor. İlk grafik, beş kadınla bir erkek arasındaki ilişkiyi gösteriyor gibi görünüyor, bu da örneklemde erkek gözlemlerinin beş katı kadar kadın gözlemi olduğunu düşündürüyor.
İlk grafikteki aralık yanıltıcıdır aşağıda döneceğiz bir problem bu yüzden % 2 puanlık fark gerçekte olduğundan daha büyük görünüyor. Bu nedenle, ikinci grafik tercih edilen temsil şeklidir.
Bir pasta grafiğin iki alternatif biçimi kullanıldığında benzer bozulmalar ortaya çıkabilir. İlk çizelgede her bir kamanın boyutu göreli frekansı temsil eder. Grafik, daire segment açılarının her bir açı αi 1⁄4 f (xi) 360 olacak şekilde ağırlıklandırılmasıyla çizilir.
Çoğu izleyici pasta grafikleri üstten saat yönünde okuduğundan, vurgulanacak özellikler mümkün olduğunca saat 12 konumuna yerleştirilmelidir. Ayrıca, grafik çok fazla bölüm içermemelidir, aksi takdirde grafiğin okunması zor olacaktır. Ayrıca, örneğin boyut veya içerik gibi bazı sistemler tarafından da sıralanmalıdırlar.
Analiz yöntemleri Nicel veri analiz yöntemleri SPSS veri analiz yöntemleri Veri analiz yöntemleri PDF Veri analizi Makale Veri analizi Nedir Nasıl Yapılır Veri analizi örnekleri Verilerin Analizi Nedir