- Korelasyon katsayısı nasıl hesaplanır?
- Kovaryans ve varyans
- Örnek durum
- Kovaryans Sxy
- Standart sapma Sx
- Standart sapma Sy
- Korelasyon katsayısı r
- yorumlama
- Doğrusal regresyon
- Misal
- Referanslar
Korelasyon katsayısı istatistik tedbirleri iki sayısal değişkenler X ve Y eğilimi, doğrusal ya da bunların arasındaki oransal bir ilişki için bir işaretidir.
Genel olarak, X ve Y değişken çiftleri aynı popülasyonun iki özelliğidir. Örneğin, X bir kişinin boyu ve Y ağırlığı olabilir.

Şekil 1. Dört veri çifti (X, Y) için korelasyon katsayısı. Kaynak: F. Zapata.
Bu durumda, korelasyon katsayısı, belirli bir popülasyonda boy ve kilo arasında orantılı bir ilişkiye doğru bir eğilim olup olmadığını gösterir.
Pearson'un doğrusal korelasyon katsayısı küçük harf r ile gösterilir ve minimum ve maksimum değerleri sırasıyla -1 ve +1'dir.
R = +1 değeri, çiftler kümesinin (X, Y) mükemmel şekilde hizalandığını ve X büyüdüğünde Y'nin aynı oranda büyüyeceğini gösterir. Öte yandan, eğer r = -1 olursa, çiftler kümesi de mükemmel bir şekilde hizalanır, ancak bu durumda X arttığında, Y aynı oranda azalır.

Şekil 2. Doğrusal korelasyon katsayısının farklı değerleri. Kaynak: Wikimedia Commons.
Öte yandan, r = 0 değeri, X ve Y değişkenleri arasında doğrusal bir korelasyon olmadığını gösterirken, r = +0,8 değeri, çiftlerin (X, Y) bir tarafta kümelenme eğiliminde olduğunu ve belirli bir çizgiden başka.
Korelasyon katsayısını hesaplamak için formül r aşağıdaki gibidir:

Korelasyon katsayısı nasıl hesaplanır?
Doğrusal korelasyon katsayısı, bilimsel hesap makinelerine, çoğu elektronik tabloya ve istatistiksel programlara yerleştirilmiş istatistiksel bir niceliktir.
Bununla birlikte, onu tanımlayan formülün nasıl uygulandığını bilmek uygundur ve bunun için küçük bir veri seti üzerinde gerçekleştirilen ayrıntılı bir hesaplama gösterilecektir.
Ve önceki bölümde belirtildiği gibi, korelasyon katsayısı, Y değişkeni için X ve Sy değişkenleri için standart sapma Sx çarpımına bölünen Sxy kovaryansının çarpımıdır.
Kovaryans ve varyans
Kovaryans Sxy:
Sxy = / (N-1)
Toplamın 1'den N veri çiftine gittiği yer (Xi, Yi).
Kendi açısından, X değişkeninin standart sapması, Xi veri kümesinin varyansının kareköküdür, i 1'den N'ye:
Sx = √
Benzer şekilde, Y değişkeninin standart sapması, Yi veri setinin varyansının kareköküdür, i 1'den N'ye:
Sy = √
Örnek durum
Korelasyon katsayısının nasıl hesaplanacağını ayrıntılı olarak göstermek için, aşağıdaki dört çift veri kümesini alacağız
(X, Y): {(1, 1); (2. 3); (3, 6) ve (4, 7)}.
Önce X ve Y için aritmetik ortalamayı şu şekilde hesaplıyoruz:
Ardından kalan parametreler hesaplanır:
Kovaryans Sxy
Sxy = / (4-1)
Sxy = / (3) = 10,5 / 3 = 3,5
Standart sapma Sx
Sx = √ = √ = 1.29
Standart sapma Sy
Sx = √ =
√ = 2.75
Korelasyon katsayısı r
r = 3,5 / (1,29 * 2,75) = 0,98
yorumlama
Önceki durumun veri setinde, hem dağılım grafiğinde (Şekil 1'de gösterilen) hem de korelasyon katsayısında ortaya çıkan X ve Y değişkenleri arasında güçlü bir doğrusal korelasyon gözlenir ve birliğe oldukça yakın değer.
Korelasyon katsayısı 1 veya -1'e yakın olduğu ölçüde, veriyi bir çizgiye sığdırmak, doğrusal regresyonun sonucu daha mantıklıdır.
Doğrusal regresyon
Doğrusal regresyon doğrusu, en küçük kareler yönteminden elde edilir. Burada regresyon doğrusunun parametreleri, N verilerinin tahmini Y değeri ile Yi arasındaki farkın karesinin toplamının en aza indirilmesinden elde edilir.
Öte yandan, y = a + bx regresyon çizgisinin a ve b parametreleri, en küçük kareler yöntemiyle elde edilir:
* b = Sxy / (Sx 2 ) eğim için
* a =
Sxy'nin yukarıda tanımlanan kovaryans olduğunu ve Sx 2'nin yukarıda tanımlanan standart sapmanın varyansı veya karesi olduğunu hatırlayın .
Misal
Korelasyon katsayısı, iki değişken arasında doğrusal bir korelasyon olup olmadığını belirlemek için kullanılır. İncelenecek değişkenler kantitatif olduğunda uygulanabilir ve ayrıca normal bir tip dağılım izledikleri varsayılır.
Aşağıda açıklayıcı bir örneğimiz var: obezite derecesinin bir ölçüsü, bir kişinin kilogram cinsinden ağırlığının, metre kare cinsinden kişinin boyunun karesine bölünmesiyle elde edilen vücut kitle indeksidir.
Vücut kitle indeksi ile kandaki HDL kolesterol konsantrasyonu arasında, litre başına milimol olarak ölçülen güçlü bir korelasyon olup olmadığını bilmek istiyorsunuz. Bu amaçla 533 kişi ile aşağıdaki grafikte özetlenen ve her noktanın bir kişinin verilerini temsil ettiği bir çalışma yapılmıştır.

Şekil 3. 533 hastada BMI ve HDL kolesterol çalışması. Kaynak: Aragonese Sağlık Bilimleri Enstitüsü (IACS).
Grafiğin dikkatli bir şekilde incelenmesi, HDL kolesterol konsantrasyonu ile vücut kitle indeksi arasında belirli bir doğrusal eğilim (çok belirgin olmayan) olduğunu göstermektedir. Bu eğilimin nicel ölçüsü, bu durumda r = -0.276 olduğu ortaya çıkan korelasyon katsayısıdır.
Referanslar
- González C. Genel İstatistikler. Kurtarıldı: tarwi.lamolina.edu.pe
- IACS. Aragonese Sağlık Bilimleri Enstitüsü. Kurtarıldı: ics-aragon.com
- Salazar C. ve Castillo S. İstatistiğin temel ilkeleri. (2018). Kurtarıldı: dspace.uce.edu.ec
- Superprof. Korelasyon katsayısı. Kurtarıldığı kaynak: superprof.es
- USAC. Tanımlayıcı istatistikler kılavuzu. (2011). Kurtarıldı: stats.ingenieria.usac.edu.gt
- Vikipedi. Pearson korelasyon katsayısı. Es.wikipedia.com adresinden kurtarıldı.
