- Örnekler
- Kategorik değişkenlerin sınıflandırılması
- Nominal kategoriler
- Sıralı kategorik
- İkili kategoriler
- Kategorik değişkenli istatistikler
- Kategorik değişkenlerin grafik gösterimi
- Çözülmüş egzersizler
- 1. Egzersiz
- Örnek 2
- Örnek 3
- Referanslar
Kategorik değişken bir amacı, tek tek, bir varlık, durum ya da işlemin bir sayısal olmayan veya nitel nitelik veya özellik atamak için burada istatistikte kullanılan biridir. Her ihtiyaca göre her türlü kategorik değişkeni tanımlamak mümkündür.
Kategorik değişkenlerin örnekleri şunlardır: renk, cinsiyet, kan grubu, medeni durum, materyal türü, ödeme şekli veya banka hesabı türü ve bunlar günlük olarak çokça kullanılır.
Şekil 1: Renk kategorik bir değişkendir. Kaynak: Pixabay
Yukarıdakiler değişkenlerdir, ancak bunların olası değerleri niteldir, yani nitelik veya karakteristiktir ve sayısal bir ölçüm değildir. Örneğin, değişken cinsiyet için olası değerler şunlardır: erkek, h embra.
Bu değişken bir bilgisayar programında depolandığında, bir metin değişkeni olarak bildirilebilir ve kabul edilen tek değerler, önceden adlandırılmış olanlar olacaktır: Erkek, Kadın.
Bununla birlikte, aynı cinsiyet değişkeni, Erkek'e 1 ve Kadın'a 2 değeri atanırsa bir tam sayı olarak bildirilebilir ve saklanabilir. Bu nedenle, kategorik değişkenlere bazen numaralandırılmış tür olarak atıfta bulunulur.
Kategorik değişkenlerin temel özelliği, sürekli ve ayrık değişkenler gibi diğer değişkenlerden farklı olarak onlarla aritmetik yapmanın mümkün olmamasıdır. Ancak, daha sonra görüleceği gibi, bunlarla istatistik yapılabilir.
Örnekler
Aşağıdaki kategorik değişken örneklerine ve olası değerlerine dikkat edin:
- Group_Sanguíneo, Değer aralığı: A, B, AB, O
- Civil_Status, Kategorik Değerler: Bekar (A), Evli (B), Dul (C), Boşanmış (D).
- Tipo_de_Material, Kategoriler veya değerler: 1 = Ahşap, 2 = Metal, 3 = Plastik
-Form_of_Payment, Menkul Kıymetler veya kategoriler: (1) Nakit, (2) Borç, (3) Transfer, (4) Kredi
Önceki örneklerde, her bir kategoriyle tamamen keyfi bir şekilde bir sayı ilişkilendirilmiştir.
O halde, bu keyfi sayısal ilişkinin onu ayrı bir nicel değişkene eşdeğer kıldığı düşünülebilir, ancak bu değildir, çünkü bu sayılarla aritmetik işlemler yapılamaz.
Fikri açıklamak için Form_of_Payment değişkeninde toplam işlemi bir anlam ifade etmiyor:
(1) Nakit + (2) Borç asla eşit olmayacak (3) Transfer
Kategorik değişkenlerin sınıflandırılması
Sıralama, örtük bir hiyerarşiye sahip olup olmadıklarına veya olası sonuçların sayısının iki veya ikiden fazla olmasına bağlıdır.
Sadece bir olası sonucu olan kategorik bir değişken, bir değişken değildir, kategorik bir sabittir.
Nominal kategoriler
Bir sayı ile temsil edilemediklerinde veya herhangi bir sıraya sahip olmadıklarında. Örneğin, Type_of_Material değişkeni nominal değerlere (Ahşap, Metal, Plastik) sahiptir, her yanıta veya kategoriye rastgele bir numara atanmış olsa bile hiyerarşileri veya sıraları yoktur.
Sıralı kategorik
Değişken: Academic_performance
Nominal değerler: Yüksek, Orta, Düşük
Bu değişkenin değerleri sayısal olmasa da, örtük bir sıraya veya hiyerarşiye sahiptir.
İkili kategoriler
Bunlar, iki olası yanıtı olan nominal değişkenlerdir, örneğin:
-Variable: Yanıt
-Nominal değerler: True, False
Response değişkeninin örtük bir hiyerarşiye sahip olmadığına ve yalnızca iki olası sonuca sahip olduğuna dikkat edin, bu nedenle ikili bir kategorik değişkendir.
Bazı yazarlar bu türe ikili değişken adını verir ve üçten fazla olası kategoriye sahip olanlarla sınırlı olan kategorik değişkenlere ait olduğunu düşünmez.
Kategorik değişkenli istatistikler
İstatistikler, sayısal veya nicel değişkenler olmamasına rağmen kategorik değişkenlerle yapılabilir. Örneğin, kategorik bir değişkenin eğilimini veya en olası değerini bilmek için mod alınır.
Mod, bu durumda, kategorik bir değişkenin en çok tekrarlanan sonucu veya değeridir. Kategorik değişkenler için, ortalamayı veya medyanı hesaplamak mümkün değildir.
Kategorik değişkenlerle aritmetik yapamayacağınız için ortalama hesaplanamaz. Medyan da değildir, çünkü nicel veya kategorik değişkenler bir sıraya veya hiyerarşiye sahip değildir, bu nedenle merkezi bir değer belirlemek mümkün değildir.
Kategorik değişkenlerin grafik gösterimi
Belirli bir kategorik değişken verildiğinde, bu değişkenin bir sonucunun tekrarlanma sıklığı veya sayısı bulunabilir. Bu her sonuç için yapılırsa, her bir kategori veya sonuca göre sıklığın bir grafiği yapılabilir.
Kategorik değişkenlerin grafiksel olarak nasıl temsil edilebileceğine dair bazı örnekler.
Çözülmüş egzersizler
1. Egzersiz
Bir şirket, 170 çalışanın verilerinin kayıtlarına sahiptir. Bu kayıtlarda bulunan değişkenlerden biri: Estado_Civil. Bu değişkenin dört kategorisi veya olası değerleri vardır:
Bekar (A), Evli (B), Dul (C), Boşanmış (D).
Sayısal olmayan bir değişken olmasına rağmen, aşağıdaki şekilde gösterildiği gibi, toplam kayıtların kaç tanesinin belirli bir kategoride olduğunu ve bir çubuk grafik şeklinde temsil edilebileceğini bilmek mümkündür:
Şekil 2. Kategorik bir değişkenin sonuçlarının gösterimi. Kaynak: kendi kendine
Örnek 2
Bir ayakkabı mağazası, satışlarının kaydını tutar. Kayıtlarını yöneten değişkenler arasında her modelin ayakkabı rengi de bulunmaktadır. Değişken:
Color_Shoe_Model_AW3
Kategorik tiptedir ve beş kategoriye veya olası değere sahiptir. Bu değişkenin her bir kategorisi için satış sayısı toplanır ve bunların yüzdesi belirlenir. Sonuçlar aşağıdaki şeklin grafiğinde sunulmuştur:
Şekil 3. Kategorik değişken Color _Shoe. Bu değişkende mod Beyaz'dır. Kaynak: kendi kendine.
O halde moda olan AW3 ayakkabı modelinden en çok satılan modelin Beyaz, ardından Siyah'ın yakından takip ettiği söylenebilir.
Bu modelin bir sonraki ayakkabısının% 70 olasılıkla Beyaz veya Siyah olacağı da söylenebilir.
Bu bilgiler, yeni sipariş verirken mağaza için yararlı olabilir veya fazla stok nedeniyle en az satılan renklerde indirim bile uygulayabilir.
Örnek 3
Belirli bir kan bağışçısı popülasyonu için, belirli bir kan grubuna ait kişilerin sayısını temsil etmek istersiniz. Sonuçları görselleştirmenin grafik bir yolu, tablonun altında bulunan bir piktogramdır.
İlk sütun, group_sanguíneo değişkenini ve olası sonuçlarını veya kategorilerini temsil eder. İkinci sütun, her bir kategorideki kişi sayısının ikonik veya resimli biçiminde temsiline sahiptir. Örneğimizde, simge olarak her biri 10 kişiyi temsil eden kırmızı bir damlacık kullanılmıştır.
Şekil 4. Piktogram. Kaynak: kendi kendine
Referanslar
- Khan Akademisi. Kategorik verileri analiz etmek. Khanacademy.org'dan kurtarıldı
- Evren formülleri. Nitel değişken. Univesoformulas.com'dan kurtarıldı
- Minitab. Kategorik, ayrık ve sürekli değişkenler. Support.minitab.com adresinden kurtarıldı
- Excel eğitimi. Değişkenlerin karakterizasyonu. Help.xlslat.com adresinden kurtarıldı.
- Vikipedi. İstatistiksel Değişken. Wikipedia.com'dan kurtarıldı
- Vikipedi. Kategorik değişken. Wikipedia.com'dan kurtarıldı
- Wikipedia. Kategorik değişken. Wikipedia.com'dan kurtarıldı