Niceliksel Regresyon – SPSS Ödevi Yaptırma – SPSS Analizi Yaptırma Fiyatları – SPSS Örnekleri – Ücretli SPSS Analizi Yaptırma – SPSS Analizi Yaptırma Ücretleri
Niceliksel Regresyon—Havayolu Gecikmelerini Tahmin Etme
Sıradan regresyon, bir dizi açıklayıcı değişkene bağlı olarak sürekli bir bağımlı değişkenin ortalamasını tahmin eder.
Y, bağımlı değişken değerlerinin bir Nx1 vektörü olduğunda, X, açıklayıcı değişkenlerin bir Nxk matrisidir ve , açıklayıcı değişkenlerden bağımsız ve σ2 varyansına sahip, bağımsız, aynı şekilde dağılmış gözlemlenmemiş rastgele hataların bir Nx1 vektörüdür. Bir dizi X değeri verildiğinde, Y dağılımının koşullu Xβ ortalaması vardır. Eğer geleneksel olarak, ’nin Normal bir dağılıma sahip olduğunu varsayarsak, o zaman X’e bağlı olan Y de yapar. Parametreler tipik olarak İstatistikte REGRESYON gibi bir prosedür kullanılarak Sıradan En Küçük Kare (OLS) ile tahmin edilir.
Bu model çok çeşitli gerçek uygulamalarda iyi çalışır, ancak bazen ortalamadan başka Y’nin koşullu dağılımının yönleriyle ilgileniriz, ancak hata terimi için normallik varsayımına bağlı olmak veya X değişkenlerini varsaymak istemiyoruz. Y dağılımı boyunca aynı etkiye sahiptir.
Örneğin, bir havalimanı yöneticisi, bir havayolu planlayıcısı veya belirli bir havalimanında bağlantı kurması gereken bir gezgin olduğunuzu varsayalım. Yolculara bağlantı kurma olasılığının yüksek olması için uçuşlar arasında ne kadar zaman kalması gerektiğini bilmek istiyorsunuz. Varıştan kalkış kapısına gitmek için gereken bilinen süreye ek olarak, varış gecikmeleri meydana gelebilir.
Varış zamanı gecikmeleri, günün saati, haftanın günü, belirli havayolu, hava trafiği, hava durumu ve varış ve varış havaalanları gibi bir dizi faktöre bağlıdır. Gelen bir uçuşun ortalama varış gecikmesini, sıradan regresyon kullanarak bu tür değişkenlerin bir fonksiyonu olarak modelleyebiliriz, ancak buradaki ilgi çekici soru, varış gecikmesinin ne sıklıkla yolcunun bağlantısını kaçıracağı kadar büyük olacağıdır.
Nicel regresyon bu soruyu cevaplamamıza yardımcı olabilir. Gelen uçuşun ortalama varış gecikmesiyle ilgilenmek yerine, açıklayıcı değişkenlerimize bağlı olarak gecikme dağılımının, örneğin 90. yüzdelik dilimin daha fazlasını tahmin etmek istiyoruz. Varış gecikme dağılımının birçok kantilini tahmin etmek isteyebiliriz.
Regresyon
Lojistik regresyon
Regresyon analizi
Regresyon Nedir
Regresyon katsayısı Nedir
Regresyon Analizi ders notları
Basit regresyon analizi
Regresyon analizi Örnekleri
Olağan regresyon varsayımları karşılanırsa, OLS’yi uygulayabilir ve uygun hata dağılımı miktarını ekleyebiliriz, ancak bu varsayımları yapmak istemeyebiliriz. Dağılımı çeşitli gecikme miktarlarında keserek lojistik regresyonu da düşünebiliriz, ancak nicel regresyon bize gecikme dağılımının en kapsamlı resmini verir ve açıklayıcı değişkenlerin etkisinin nicelikler arasında farklılık gösterip göstermediğini test etmemizi sağlar.
Pratik bir konu olarak, bağlantı havaalanında varış ve kalkış gecikmeleri arasındaki korelasyon gibi bu örneğin kapsamı dışında başka komplikasyonlar da vardır, ancak örnek geleneksel regresyon yaklaşımı ile kantil regresyon yaklaşımı arasındaki farka odaklanmaktadır.
Bu örneğe ilişkin veriler, Amerika Birleşik Devletleri Ulaştırma Bakanlığı Ulaştırma İstatistikleri Bürosu’ndan alınmıştır. Veri seti, ABD’deki tüm ticari uçuşlar için varış ve kalkış bilgilerini kaydeder. Uygun bir kaynak burada mevcuttur.
Tüm veri seti çok büyüktür, bu örnek için değiştirilmiş bazı değişkenlerin tanımını içerir. CRS, Bilgisayarlı Rezervasyon Sistemleri, yani planlanmış zamanlar anlamına gelir. Orijinal değişkenlerin ayrıntılı tanımlarını burada bulabilirsiniz. Verileri bir yıl boyunca kullanacağız ve birçok transferin gerçekleştiği çok yoğun iki Chicago havalimanına, O’Hare (ORD) ve Midway’e (MDW) odaklanacağız.
Veri kümesi, CarrierDelay, WeatherDelay, NASdelay, SecurityDelay ve LateAircraftDelay gecikme değişkenlerini içerir, ancak varış gecikmesi en az 15 dakika olmadığı sürece bunlar rapor edilmez, yani eksiktir. Bu değişkenler elbette bir seyahat planlanırken bilinmezler ve bağımlı değişkeni bölümlere ayırırlar, bu yüzden onları burada kullanmayacağız. İptalleri ve sapmaları modellemek yolcular için faydalı olabilir, ancak yine de uçuşu kaçırırsınız ve bunlar verilerin çok küçük bir yüzdesidir.
Uçuş hacminin %2’sinden daha azını temsil eden küçük havayolları, sekiz kategori bırakarak DİĞER kategorisine daraltılmış ve eksik verili az sayıda vaka ve iptal edilen veya yönlendirilen uçuşlar için vakalar atılmıştır.
Bir yıllık veri setimizde TANIMLAR çalıştırdığımızda 7.000,728 uçuş kaydettiğini görüyoruz. Yalnızca Chicago havalimanlarına gelen yolcuları seçerek (Dest = ORD veya MDW), 419.322 uçuşumuz var. Her iki havaalanında da varış gecikmelerinin nüfus piramidini çizerek, dağılımın Şekil 18-10’da gösterildiği gibi oldukça asimetrik olduğunu görüyoruz.
SUMMARIZE ile bazı istatistikleri hesaplayarak, gösterilen sonuçları elde ederiz. Bu, grafikte gördüğümüz çarpıklığı doğrulamaktadır. Ayrıca, ORD’de ortalama gecikmenin çok daha büyük olduğuna dikkat edin, ancak medyan gecikme hemen hemen aynıdır. Bu istatistikler, gecikmelerin normal olmadığını gösterir, ancak henüz herhangi bir değişken için kontrol etmedik ve bu, hata terimlerinin normalliğidir, değil, hata terimlerinin normalliğidir.
Gecikmelerle ilgili havaalanı yönetimi çalışması için, tahmin etmekten çok sebeplerle ilgileniyoruz, yolcuların karar vermesi için ise, belirli bir yolculuk sırasında bağımsız değişken değerlerinin tahmin edilmesini gerektiren tahminle daha çok ilgileniyoruz.
Gecikme değişkenlerini kullanıyor olsaydık ve bunların bazılarını önceden bilmiyor olsaydık, hedef havaalanı için ortalamaları kullanabilirdik. Regresyon modelimiz için, faktörler olarak Month, DayOfWeek, uniqueCarrierCollapsed ve CRSArrTimeHr ve ortak değişken olarak CRSElapsedTime kullanacağız. Öngörülen değerleri nicel regresyon sonuçlarıyla karşılaştırmak için kaydedeceğiz.
Faktörleri ele almak için daha uygun olduğu için REGRESYON yerine UNIANOVA kullanıyoruz, ancak faktör değişken kuklalarını açıkça oluşturup REGRESYON kullansaydık sonuçlar aynı olurdu. Veriler, “MDW” ve “ORD” değerlerine sahip DEST tarafından bölünür.
Tüm faktörler ve ortak değişken oldukça önemlidir. Burada tüm sonuçları göstermiyoruz, ancak özetlemek gerekirse, diğer değişkenleri sabit tutarak Midway için varış zamanı gecikmeleri en fazla Pazartesi günleri ve Aralık ayında sabah 6-8 arasıdır. Daha uzun uçuşlarda daha az gecikme olur. O’Hare için, 2am–3am planlı varış saatleri büyük gecikmelere sahiptir ve bundan sonra 06:00–7am’dir. Cuma en kötü gün ve Aralık en kötü aydır. Daha uzun uçuşlar, Midway’deki –.974’e kıyasla saatte –.3.96 dakika daha düşük gecikmelere sahiptir.
Kuantil regresyonun yanına dönüyoruz. Aşağıdaki kod parçacığı, Analyze ➪ Regresyon ➪ Nicel Regresyon tarafından oluşturulan aynı model için sözdizimini gösterir.
Bu, varış gecikmesinin %50, %70 ve %90 niceliklerini tahmin eder. Bölünmüş dosyalar açıkken, iki havaalanı için ayrı tahmin sonuçları alıyoruz. Barrodale-Roberts (BR) olan varsayılan tahmin yöntemini kullanıyoruz, ancak daha sonra tartışılacak nedenlerden dolayı standart katsayı hataları için varsayılan olmayan bir yöntem kullanıyoruz.
Ayrıca, tüm katsayıların ortak bir eşitlik testi veya her bir katsayı için ayrı testler için SEÇENEKLER’de ANOVA=JOINT veya ANOVA=SEPARATE belirterek regresyon katsayılarının seçilen nicelikler için farklı olup olmadığını test edebiliriz. Kesişme dışında katsayılar farklı değilse, yani tüm kantil çizgileri paralelse, daha basit regresyon modeli yeterli olabilir.
Basit regresyon Analizi Lojistik regresyon Regresyon Regresyon analizi Regresyon Analizi ders notları Regresyon analizi Örnekleri Regresyon katsayısı Nedir Regresyon Nedir