Titanik Veri Kümesi – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri
KNN’yi Kullanma
KNN’nin sadece sınıflandırmak için kullanılmasına gerek yoktur (bir sonraki bölümde tartışılacaktır). Bazen yalnızca mesafeleri bulmak için kullanılır – genellikle hangi veri noktalarının en yakın olduğunu bulmak amacıyla. Girdi değişkenlerinde diğer yolculara benzer yolcuları bulmak için tekniği hedef değişken olmadan basitçe çalıştırabiliriz. Tekniğin bu yönü, eHarmony flört sitesi hizmeti gibi bir durumda da geçerli olabilir. eHarmony gibi bir arkadaşlık sitesi söz konusu olduğunda, geleneksel anlamda tahminde bulunmaz.
Bu, basitçe, diğer kayıtlardan (asgari uzaklığı anket sorularında benzer yanıtları ima eden kadınlar) yakın olan (kelimenin tam anlamıyla Öklid mesafesi veya başka bir mesafe ölçüsü açısından) olan kayıtları (örneğin erkekler) belirlemektir. Bir flört sitesi durumundaki yaklaşımın arkasındaki teori, bir kişiyle “bağlantı”nın, çok sayıda sorudaki benzer yanıtlarla ölçülen “uyumluluk” yoluyla daha olası hale getirilmesidir.
Bir flört web sitesi fikri, bunun gibi bir modelin nasıl yerleştirileceğini hayal etmemize de yardımcı olur. Algoritma, erkeklerin konumlarını “ezberleyecek” ve ardından tek bir kadına uygulanabilecekti. Bekar bir erkeğe en yakın kadınları bulmaya çalışıyor olsaydık, bunun tersi yapılabilirdi.
IBM SPSS Modeler Cookbook Modeler’da da bu tekniği desteklemektedir. Bu, kurgusal bir çağrı merkezindeki satış personelini, benzer profillere sahip gelen arama müşterileri ile eşleştirmeyi içerir: satış temsilcileri, yaptıkları satışlar ve yaptıkları satın almalar açısından müşterilerdir.
Temsilci satışları ve müşteri harcaması oranlarını gösterir ve belirli bir Müşteri/Temsilci çifti için oranlar arasında özdeş bir model ortaya çıkarır. En yakın olan çiftler bu kategorilerde benzer dolar oranlarına sahiptir. Şekilde, hem Müşteri hem de Temsilci, Video Oyunları hariç tüm kategorilerde sıfıra sahiptir. Tüm çiftler aynı olmayacak, ancak “en yakın komşular” ise, oranlardaki model çok benzer olacaktır.
Temsilci #32, bu müşteri için en yakın “komşu”dur, bu nedenle, gelen her müşteriye en iyi eşleşen temsilciyi yönlendiren otomatik bir sistem hayal edilebilir. Herhangi bir müşteri için kuyrukta bir gecikme yaratmadığı sürece, daha iyi bir eşleşmeye yönlendirme, yalnızca ilk kullanılabilir olana yönlendirmekten daha iyi bir sistem olabilir. Kalıcı olarak eşleştiriliyorlarsa – belki bir yatırımcı ve bir komisyoncu, o zaman özellikle yararlı olabilir. Benzerlikleri, benzer ilgi alanları ve deneyimleri içerdiği için değerli olmalıdır.
Sınıflandırıcı Olarak Kullanılan Titanik Veri Kümesi ve KNN
Sınıflandırma için kullanıldığı şekliyle KNN, veri noktalarının yakınlığını bulmak için kullanıldığından biraz farklıdır. Önce en yakın “komşuları” buluyoruz, sonra hedef değişkendeki hangi kategorinin komşular için en yaygın olduğunu belirliyoruz. Bu kategori, puanlanan herhangi bir kayıt için tahmin edilen kategorimiz olur.
Tabii Titanic veri setini bu teknikle kullanmanın ilginç yanlarından biri de çıktıda “odak noktası” ve “komşu” isimlerini göreceğimiz. Bazen adın kendisi, “Usta” Eugene Rice adlı bir çocuk gibi, kişi hakkında merak uyandıran bir şey ortaya çıkarabilir.
Bu örnek için kitabın web sitesinde bulunan Titanic_Results.sav dosyasını kullanacağız. Bu dosya, her ikisi de açıklanan adımlar kullanılarak oluşturulan bir ağaç modelinin ve bir sinir ağı modelinin tahminlerini temsil eden değişkenlere sahiptir.
Ayarlarda sadece küçük ayarlamalar ve dört tahminci ile başlayacağız. Spesifik olarak, gösterildiği gibi, Survived with Pclass, Age, Sex ve Parch’ı tahmin edeceğiz. SibSp ve Embarked’i de ekleyebiliriz, ancak biliyoruz ki (ağaçlar ve sinir ağları kullanarak) bunların en önemli dörtlü olduğunu biliyoruz. KNN çıktısını daha az girdi ile sindirmek biraz daha kolay olacaktır. (Değişken sırasının bir fark yarattığını unutmayın, çünkü inceleyeceğimiz çıktının bir kısmı yalnızca ilk üçünü gösterecektir.) Gösterildiği gibi Adı Vaka Etiketi olarak dahil edin.
Titanik veri seti
Titanik projesi
Kaggle
Model Tuning Nedir
Titanic dataset csv
Son belirleyici olan Parch, yolcuyla birlikte seyahat eden ebeveyn ve çocuk sayısıdır. Bu tahmin ediciyi dahil etmek, örneğin endişelenecek bir bağımlıya sahip olmanın gemide hareketi daha zor hale getirip getirmediğini belirlemenize yardımcı olacaktır. Veya alternatif olarak, bakmakla yükümlü olunan kişilere sahip olmanın yetişkin bir erkeğin ailesinin geri kalanıyla birlikte kalabileceği için hayatta kalma olasılığını artırıp artırmadığı.
Parch’ın bir ölçek değişkeni olarak bildirildiğini unutmayın. Bir ölçek değişkeni az sayıda tamsayı düzeyinde kategoriye sahip olduğunda, SPSS genellikle varsayılan olarak onu nominal olarak ele alacaktır. Adını Vaka Etiketi olarak kullanacağız. Bu, çıktıya yolcunun adını ekleyecektir. Sinir ağı, karar ağaçları ve KNN’yi kolayca karşılaştırmak için KNN’nin diğer algoritmalar için oluşturduğumuz aynı Partition Variable’ı kullanmasını sağlayacağız. (Ağaç modeli ve sinir ağının sonuçlarını içeren Titanic_Results.sav dosyasını kullandığınızdan emin olun)
Sonuçları görmek için çıktı penceresindeki Model Görüntüleyici’ye çift tıklamalısınız. Sonuçlarımızda belirli bir “Odak Noktasını” tıklayabiliriz. Daire kırmızıya dönecek. Bunu yaptığınızda sağda ikinci bir diyagram belirecektir. Yalnızca görüntüden, “odak kaydı” olan kişiyi saptamak zor olabilir.
Sağda gösterilecek diyagram için birkaç seçenek vardır. Bir seçenek, görüntülenen “Komşular ve Mesafeler” tablosudur. Varsayılan k=3 ile gittiğimizden, en yakından en uzağa sırayla üç adede kadar tam adı gösterir. Gördüğünüz gibi, Bay Svensson’ın en yakın “komşuları” Bay Patrick Connors, Bay Frank Duane ve Bay Johan Hansen Nysveen’dir.
Seçtiğimiz değişkenlerde en yakın yolculara daha yakından bakan Peers tablosu da var. Bay Svensson, tüm komşularının aynı kaderi paylaştığı ve bu durumda bir sınıflandırıcı olarak etkinliğini doğruladığı için “Eşler Tablosu”nda gösterildiği gibi teknik için bir zaferdi.
Tahmin edeceğimiz gibi, Bay Svensson’ın en yakın komşularından üçünün de yaptığı gibi, kazada genellikle yetişkin erkekler öldü. Hepsi erkekti, 3. sınıftı ve 60’larında veya 70’lerinin başındaydı. Bay Svensson, 73 yaşında en yaşlıydı. Hiçbirinin gemide bağımlısı yoktu. Görüntülenecek çok fazla tahminci olduğunda, daha azını göstermek için Tahminleri Seç seçeneğini kullanabileceğinizi unutmayın.
Kaggle Model Tuning Nedir Titanic dataset csv Titanik projesi Titanik veri seti