- Belirleme katsayısı nasıl hesaplanır?
- Örnek durum
- yorumlama
- Örnekler
- - Örnek 1
- Çözüm
- - Örnek 2
- Çözüm
- - Örnek 3
- Çözüm
- Uygun karşılaştırma
- Sonuçlar
- Referanslar
Belirleme katsayısı iki değişken ile bir veri setinin uyum regresyon çizgisini takip nokta (X, Y) kısmını temsil ettiği, 0 ile 1 arasında bulunan bir sayıdır.
Ayrıca uyum iyiliği olarak bilinir ve R ile gösterilir 2 . Bunu hesaplamak için, regresyon modeli tarafından tahmin edilen verinin Ŷi varyansı ile verinin her Xi'sine karşılık gelen Yi verisinin varyansı arasındaki bölüm alınır.
R 2 = Sŷ / Sy

Şekil 1. Dört çift veri için korelasyon katsayısı. Kaynak: F. Zapata.
Verilerin% 100'ü regresyon fonksiyonunun satırındaysa, belirleme katsayısı 1 olacaktır.
Tersine, bir veri seti ve R katsayısı belirli bir ayarlama fonksiyonu için ise 2 tur üzerinden 0.5'e eşit olacak şekilde, daha sonra ayarı 50% ya da tatmin edici iyi olduğu söylenebilir.
Regresyon modeli verimleri R Benzer şekilde, 2 değerleri 0.5'den daha düşük, bu seçilen ayarlama fonksiyonu nedenle başka bir ayarlama fonksiyonu aramak için gerekli olan verilere biçimde uyum olduğunu gösterir.
Kovaryans veya korelasyon katsayısı sıfır eğiliminde olduğunda, o zaman veri değişkenler X ve Y ilişkisizdir ve bu nedenle R 2 sıfıra da eğiliminde olacaktır.
Belirleme katsayısı nasıl hesaplanır?
Önceki bölümde, varyanslar arasındaki bölüm bulunarak belirleme katsayısının hesaplandığı söylendi:
-Y değişkeninin regresyon fonksiyonu ile tahmin edilir
-N veri çiftinin Xi değişkeninin her birine karşılık gelen Yi değişkenidir.
Matematiksel olarak ifade edildiğinde şuna benzer:
R 2 = Sŷ / Sy
Bu formülden, R 'olduğu, aşağıdaki 2 varyans oranı regresyon modeli ile açıklanmaktadır temsil eder. Seçenek olarak ise, R ' 2 hesaplanabilir öncekine tamamen eşdeğer aşağıdaki formül kullanılarak:
R 2 = 1 - (Sε / Sy)
Sε, εi = Ŷi - Yi kalıntılarının varyansını temsil ederken, Sy, verilerin Yi değerleri kümesinin varyansıdır. Ŷi'yi belirlemek için regresyon fonksiyonu uygulanır, bu da Ŷi = f (Xi) olduğunu doğrulamak anlamına gelir.
Yi veri kümesinin 1'den N'ye kadar olan varyansı şu şekilde hesaplanır:
Sy =
Ve sonra Sŷ veya Sε için benzer şekilde ilerleyin.
Örnek durum
Belirleme katsayısının hesaplanmasının nasıl yapıldığının ayrıntılarını göstermek için, aşağıdaki dört çift veri kümesini alacağız:
(X, Y): {(1, 1); (2. 3); (3, 6) ve (4, 7)}.
En küçük kareler yöntemi kullanılarak elde edilen bu veri seti için doğrusal bir regresyon uyumu önerilmiştir:
f (x) = 2,1 x - 1
Bu ayarlama işlevini uygulayarak torklar elde edilir:
(X, Ŷ): {(1, 1.1); (2, 3.2); (3, 5.3) ve (4, 7.4)}.
Sonra X ve Y için aritmetik ortalamayı hesaplıyoruz:
Varyans Sy
Sy = / (4-1) =
= = 7583
Varyans Sŷ
Sŷ = / (4-1) =
= = 7.35
Belirleme katsayısı R 2
R 2 = Sŷ / Sy = 7.35 / 7.58 = 0.97
yorumlama
Bir önceki bölümde ele alınan örnek durum için belirleme katsayısı 0,98 olarak ortaya çıktı. Başka bir deyişle, işlev aracılığıyla doğrusal ayarlama:
f (x) = 2,1x - 1
En küçük kareler yöntemi kullanılarak elde edildiği verilerin açıklanmasında% 98 güvenilirdir.
Belirleme katsayısına ek olarak, doğrusal korelasyon katsayısı vardır veya ayrıca Pearson katsayısı olarak da bilinir. R olarak gösterilen bu katsayı aşağıdaki ilişki ile hesaplanır:
r = Sxy / (Sx Sy)
Burada pay, X ve Y değişkenleri arasındaki kovaryansı temsil ederken, payda, X değişkeni için standart sapmanın ve değişken Y için standart sapmanın ürünüdür.
Pearson katsayısı -1 ile +1 arasında değerler alabilir. Bu katsayı +1 olma eğiliminde olduğunda, X ve Y arasında doğrudan doğrusal bir korelasyon vardır. Bunun yerine -1'e eğilim gösterirse, doğrusal bir korelasyon vardır, ancak X büyüdüğünde Y azalır. Son olarak, 0'a yakındır, iki değişken arasında korelasyon yoktur.
Belirleme katsayısının Pearson katsayısının karesi ile çakıştığına dikkat edilmelidir, sadece ilki doğrusal bir uyuma göre hesaplandığında, ancak bu eşitlik diğer doğrusal olmayan uyumlar için geçerli değildir.
Örnekler
- Örnek 1
Bir grup lise öğrencisi, uzunluğunun bir fonksiyonu olarak bir sarkacın dönemi için ampirik bir yasa belirlemek için yola çıktı. Bu amaca ulaşmak için, aşağıdaki değerleri elde ederek farklı uzunluklar için bir sarkaç salınımının süresini ölçtükleri bir dizi ölçüm gerçekleştirirler:
| Uzunluk (m) | Dönem (ler) |
|---|---|
| 0.1 | 0.6 |
| 0.4 | 1.31 |
| 0.7 | 1,78 |
| bir | 1.93 |
| 1.3 | 2.19 |
| 1.6 | 2.66 |
| 1.9 | 2.77 |
| 3 | 3.62 |
Verilerin dağılım grafiğini yapması ve regresyon yoluyla doğrusal bir uyum gerçekleştirmesi istenir. Ayrıca, regresyon denklemini ve belirleme katsayısını gösterin.
Çözüm

Şekil 2. Alıştırma için çözüm grafiği 1. Kaynak: F. Zapata.
Oldukça yüksek bir belirleme katsayısı (% 95) gözlemlenebilir, bu nedenle doğrusal uyumun optimal olduğu düşünülebilir. Bununla birlikte, noktalar birlikte incelendiğinde, aşağı doğru eğilme eğiliminde oldukları görülmektedir. Bu detay doğrusal modelde düşünülmemiştir.
- Örnek 2
Örnek 1'deki aynı veriler için, verilerin dağılım grafiğini yapın. Bu durumda, örnek 1'den farklı olarak, potansiyel bir fonksiyon kullanılarak bir regresyon ayarlaması istenir.

Şekil 3. Alıştırma için çözüm grafiği 2. Kaynak: F. Zapata.
Ayrıca uyum fonksiyonunu ve R 2 belirleme katsayısını gösterin .
Çözüm
Potansiyel fonksiyon, f (x) = Ax B biçimindedir , burada A ve B, en küçük kareler yöntemi ile belirlenen sabitlerdir.
Önceki şekil, potansiyel işlevi ve parametrelerini ve% 99 gibi çok yüksek bir değerle belirleme katsayısını gösterir. Verilerin trend çizgisinin eğriliğini takip ettiğine dikkat edin.
- Örnek 3
Örnek 1 ve Örnek 2'deki aynı verileri kullanarak, ikinci derece polinom uydurma gerçekleştirin. Grafik, uygun polinom ve ABS mukabil belirleme R katsayısı 2 .
Çözüm

Şekil 4. Alıştırma için çözüm grafiği 3. Kaynak: F. Zapata.
İkinci derece polinom uydurma ile verilerin eğriliğine iyi uyan bir eğilim çizgisi görebilirsiniz. Ayrıca, belirleme katsayısı doğrusal uyumun üstünde ve potansiyel uyumun altındadır.
Uygun karşılaştırma
Gösterilen üç uyumdan en yüksek belirleme katsayısına sahip olan potansiyel uyumdur (örnek 2).
Potansiyel uyum, bilindiği gibi sarkacın periyodunun uzunluğunun karekökü ile orantılı olduğunu, orantılılık sabiti 2π / √g, burada g yerçekiminin ivmesini belirleyen sarkacın fiziksel teorisi ile çakışır.
Bu tür potansiyel uyum, yalnızca en yüksek belirleme katsayısına sahip olmakla kalmaz, aynı zamanda üs ve orantılılık sabiti fiziksel modelle eşleşir.
Sonuçlar
-Regresyon ayarı, verileri en küçük kareler yöntemini kullanarak açıklamayı amaçlayan fonksiyonun parametrelerini belirler. Bu yöntem, verilerin Xi değerleri için ayarlamanın Y değeri ile verilerin Yi değeri arasındaki kare farkının toplamının en aza indirilmesinden oluşur. Bu, ayarlama işlevinin parametrelerini belirler.
-Gördüğümüz gibi, en yaygın ayarlama işlevi doğrudur, ancak ayarlamalar aynı zamanda polinom, potansiyel, üstel, logaritmik ve diğerleri de olabileceğinden tek işlev değildir.
-Her durumda, belirleme katsayısı verilere ve ayarlamanın türüne bağlıdır ve uygulanan ayarlamanın iyiliğinin bir göstergesidir.
-Son olarak, belirleme katsayısı, verilen X için ayarlamanın Ŷ değerine göre verilerin Y değeri arasındaki toplam değişkenliğin yüzdesini gösterir.
Referanslar
- González C. Genel İstatistikler. Kurtarıldı: tarwi.lamolina.edu.pe
- IACS. Aragonese Sağlık Bilimleri Enstitüsü. Kurtarıldı: ics-aragon.com
- Salazar C. ve Castillo S. İstatistiğin temel ilkeleri. (2018). Kurtarıldı: dspace.uce.edu.ec
- Superprof. Belirleme katsayısı. Kurtarıldığı kaynak: superprof.es
- USAC. Tanımlayıcı istatistikler kılavuzu. (2011). Kurtarıldı: stats.ingenieria.usac.edu.gt.
- Vikipedi. Belirleme katsayısı. Es.wikipedia.com adresinden kurtarıldı.
