- Eş varyansın önemi
- Eş varyanslılığa karşı farklı varyans
- Eş varyans testleri
- Standartlaştırılmış değişkenler
- Eş varyansının grafiksel olmayan testleri
- Referanslar
Homoscedasticity bir veya daha fazla gözlemler, varyans analizi (ya da bağımsız) desen her veri grupları halinde bir prediktif istatistiksel model meydana sahip açıklayıcı değişkenler göre sabit kalır.
Bir regresyon modeli homoskedastik olabilir veya olmayabilir, bu durumda heteroskedastisiteden söz ederiz.
Şekil 1. Beş veri kümesi ve kümenin regresyon uyumu. Öngörülen değere göre varyans her grupta aynıdır. (Upav-biblioteca.org)
Birkaç bağımsız değişkenin istatistiksel bir regresyon modeline homoskedastik denir, ancak tahmin edilen değişkenin hatasının varyansı (veya bağımlı değişkenin standart sapması) açıklayıcı veya bağımsız değişkenlerin farklı değer grupları için tekdüze kalırsa.
Şekil 1'deki beş veri grubunda, her gruptaki varyans, regresyon tarafından tahmin edilen değere göre hesaplanmış ve her grupta aynı olmasıyla sonuçlanmıştır. Ayrıca verilerin normal dağılımı izlediği varsayılmaktadır.
Grafik düzeyinde, noktaların regresyon uyumu tarafından tahmin edilen değer etrafında eşit olarak dağıldığı veya dağıldığı ve regresyon modelinin açıklayıcı değişkenin aralığı için aynı hata ve geçerliliğe sahip olduğu anlamına gelir.
Eş varyansın önemi
Tahmine dayalı istatistiklerde homoskedastisitenin önemini göstermek için, zıt fenomen olan heteroskedastisite ile karşılaştırmak gerekir.
Eş varyanslılığa karşı farklı varyans
Eş-varyansın olduğu Şekil 1 durumunda, şu doğrudur:
Var ((y1-Y1); X1) ≈ Var ((y2-Y2); X2) ≈ …… Var ((y4-Y4); X4)
Var ((yi-Yi); Xi) varyansı temsil ettiğinde, çift (xi, yi) grup i'den gelen verileri temsil ederken, Yi grubun ortalama değeri Xi için regresyon tarafından tahmin edilen değerdir. Grup i'deki n verisinin varyansı şu şekilde hesaplanır:
Var ((yi-Yi); Xi) = ∑j (yij - Yi) ^ 2 / n
Aksine, farklı varyans oluştuğunda, regresyon modeli hesaplandığı bölgenin tamamı için geçerli olmayabilir. Şekil 2, bu duruma bir örnek göstermektedir.
Şekil 2. Farklı varyans gösteren veri grubu. (Kendi detaylandırma)
Şekil 2, üç veri grubunu ve setin doğrusal regresyon kullanarak uyumunu temsil eder. İkinci ve üçüncü gruplardaki verilerin birinci gruba göre daha dağınık olduğu unutulmamalıdır. Şekil 2'deki grafik aynı zamanda her bir grubun ortalama değerini ve her bir veri grubunun σ standart sapması ile hata çubuğu ± σ'yı gösterir. Unutulmamalıdır ki, standart sapma σ varyansın kareköküdür.
Açıktır ki, heteroskedastisite durumunda, regresyon kestirim hatasının açıklayıcı veya bağımsız değişkenin değer aralığında değiştiği ve bu hatanın çok büyük olduğu aralıklarda regresyon tahmininin güvenilir olmadığı veya uygulanamaz.
Bir regresyon modelinde, hatalar veya kalıntılar (ve -Y), bağımsız değişkenin değer aralığı boyunca eşit varyansla (σ ^ 2) dağıtılmalıdır. Bu nedenle, iyi bir regresyon modelinin (doğrusal veya doğrusal olmayan) eş varyans testini geçmesi gerekir.
Eş varyans testleri
Şekil 3'te gösterilen noktalar, metrekare cinsinden büyüklük veya alana bağlı olarak evlerin fiyatları (dolar cinsinden) arasında bir ilişki arayan bir çalışmanın verilerine karşılık gelmektedir.
Test edilecek ilk model, doğrusal regresyon modelidir. Öncelikle uyumun R ^ 2 belirleme katsayısının oldukça yüksek olduğu (% 91), dolayısıyla uyumun tatmin edici olduğu düşünülebilir.
Bununla birlikte, iki bölge ayarlama grafiğinden net bir şekilde ayırt edilebilir. Bunlardan biri, sağda oval bir şekilde çevrelenmiş, homoskandastisiteyi yerine getirirken, soldaki bölge homoskedastisiteye sahip değildir.
Bu, regresyon modelinin tahmininin 1800 m ^ 2 ila 4800 m ^ 2 aralığında yeterli ve güvenilir olduğu, ancak bu bölge dışında çok yetersiz olduğu anlamına gelir. Heteroskedastik bölgede, hata çok büyük olmakla kalmaz, aynı zamanda verilerin doğrusal regresyon modelinin önerdiğinden farklı bir eğilimi izlediği görülmektedir.
Şekil 3. Konut fiyatları - alan ve doğrusal regresyon ile tahmin modeli, eş varyans ve farklı varyans bölgelerini göstermektedir. (Kendi detaylandırma)
Verilerin dağılım grafiği, eş varyanslarının en basit ve en görsel testidir, ancak, Şekil 3'te gösterilen örnekteki kadar açık olmadığı durumlarda, yardımcı değişkenleri olan grafiklere başvurmak gerekir.
Standartlaştırılmış değişkenler
Eş varyansın sağlandığı ve olmadığı alanları ayırmak için standartlaştırılmış değişkenler ZRes ve ZPred tanıtıldı:
ZRes = Abs (y - Y) / σ
ZPred = Y / σ
Y regresyon tahmininin değeri olduğu için bu değişkenlerin uygulanan regresyon modeline bağlı olduğu unutulmamalıdır. Aşağıda aynı örnek için dağılım grafiği ZRes ve ZPred verilmiştir:
Şekil 4. Eş varyans bölgesinde ZR'lerin tahmin bölgesinde tek tip ve küçük kaldığına dikkat edilmelidir (Kendi detaylandırma).
Şekil 4'teki standartlaştırılmış değişkenlerin bulunduğu grafikte, artık hatanın küçük ve tekdüze olduğu alan, olmadığı alandan açıkça ayrılmıştır. Birinci bölgede, homoskedastisite yerine getirilirken, artık hatanın oldukça değişken ve büyük olduğu bölgede, heteroskedastisite yerine getirilir.
Regresyon ayarlaması, şekil 3'teki aynı veri grubuna uygulanır, bu durumda, kullanılan model bir potansiyel işlevi içerdiğinden, ayarlama doğrusal değildir. Sonuç aşağıdaki şekilde gösterilmektedir:
Şekil 5. Doğrusal olmayan bir regresyon modeli ile veri uydurmada yeni eş varyans ve farklı varyans bölgeleri. (Kendi detaylandırma).
Şekil 5'teki grafikte, homoskedastik ve heteroskedastik alanlar açıkça belirtilmelidir. Ayrıca, bu bölgelerin, doğrusal uyum modelinde oluşturulanlara göre değiştirildiği de not edilmelidir.
Şekil 5'teki grafikte, oldukça yüksek bir uyum belirleme katsayısı olsa bile (% 93,5), modelin açıklayıcı değişkenin tüm aralığı için yeterli olmadığı açıktır, çünkü değerler için veriler 2000 m ^ 2'den daha büyük değişkenlik gösterir.
Eş varyansının grafiksel olmayan testleri
Eşcinselliğin karşılanıp karşılanmadığını doğrulamak için en çok kullanılan grafiksel olmayan testlerden biri Breusch-Pagan testidir.
Bu makalede bu testin tüm ayrıntıları verilmeyecektir, ancak temel özellikleri ve aynı adımları kabaca özetlenmiştir:
- Regresyon modeli n verisine uygulanır ve bunun varyansı, σ ^ 2 = ∑j (yj - Y) ^ 2 / n modeli tarafından tahmin edilen değere göre hesaplanır.
- Yeni bir değişken tanımlandı ε = ((yj - Y) ^ 2) / (σ ^ 2)
- Aynı regresyon modeli yeni değişkene uygulanır ve yeni regresyon parametreleri hesaplanır.
- Kritik değer Ki kare (χ ^ 2) belirlenir, bu, ε değişkenindeki yeni artıkların karelerinin toplamının yarısıdır.
- Ki kare dağılım tablosu, tablonun x eksenindeki anlamlılık seviyesi (genellikle% 5) ve serbestlik derecesi sayısı (regresyon değişkenlerinin sayısı eksi birlik) dikkate alınarak kullanılır. pano.
- 3. adımda elde edilen kritik değer, tabloda bulunan değerle (χ ^ 2) karşılaştırılır.
- Kritik değer tablodaki değerin altındaysa, sıfır hipotezimiz var: Eşit varyans var
- Kritik değer tablodaki değerin üstündeyse, alternatif hipotezimiz var: Eşit varyans yoktur.
SPSS, MiniTab, R, Python Pandas, SAS, StatGraphic ve diğerleri gibi çoğu istatistiksel yazılım paketleri Breusch-Pagan homoskedisite testini içerir. Varyansın tekdüzeliğini doğrulamak için başka bir test de Levene testidir.
Referanslar
- Kutu, Avcı ve Avcı. (1988) Araştırmacılar için istatistikler. Editörleri tersine çevirdim.
- Johnston, J (1989). Ekonometri yöntemleri, Vicens -Vives editörleri.
- Murillo ve González (2000). Ekonometri Kılavuzu. Las Palmas de Gran Canaria Üniversitesi. Ulpgc.es'den kurtarıldı.
- Vikipedi. Homoscedasticity. Kurtarıldı: es.wikipedia.com
- Vikipedi. Homoscedasticity. En.wikipedia.com adresinden kurtarıldı