Charakteristické charakteristiky proměnných a příklady

4179
Simon Doyle
Charakteristické charakteristiky proměnných a příklady

The kategorická proměnná Je to ten, který se používá ve statistikách k přiřazení nečíselné nebo kvalitativní charakteristiky nebo vlastnosti nějakému objektu, jednotlivci, entitě, podmínce nebo postupu. Je možné definovat všechny druhy kategorických proměnných podle každé potřeby. 

Příklady kategorických proměnných jsou: barva, pohlaví, krevní skupina, rodinný stav, druh materiálu, způsob platby nebo typ bankovního účtu a jsou často používány denně..

Obrázek 1: Barva je kategorická proměnná. Zdroj: Pixabay

Výše uvedené jsou proměnné, ale jejich možné hodnoty jsou kvalitativní, tj. Kvalitní nebo charakteristické, a nikoli numerické. Například možné hodnoty proměnné sex Oni jsou: mužský , hembra.

Když je tato proměnná uložena v počítačovém programu, může být deklarována jako textová proměnná a jediné přijatelné hodnoty budou ty, které již byly pojmenovány: mužský , ženský.

Stejná proměnná sex lze deklarovat a uložit jako celé číslo, pokud a mužský je přidělen 1 již ženský hodnota je přiřazena dva. Z tohoto důvodu se kategorické proměnné někdy označují jako výčtový typ.

Hlavní charakteristikou kategorických proměnných je, že na rozdíl od jiných proměnných, jako jsou spojité a diskrétní, s nimi není možné provádět aritmetiku. Můžete s nimi však provádět statistiky, jak bude vidět později.

Rejstřík článků

  • 1 Příklady
  • 2 Klasifikace kategoriálních proměnných
    • 2.1 Nominální kategorie 
    • 2.2 Pořadové kategorie
    • 2.3 Binární kategorie
  • 3 Statistiky s kategorickými proměnnými
    • 3.1 Grafické znázornění kategoriálních proměnných
  • 4 Vyřešená cvičení
    • 4.1 Cvičení 1
    • 4.2 Příklad 2
    • 4.3 Příklad 3
  • 5 Reference

Příklady

Všimněte si následujících příkladů kategorických proměnných a jejich možných hodnot:

-Krevní skupina, Rozsah hodnot: A, B, AB, O

-Rodinný stav, Kategorické hodnoty: Singl (NA), Ženatý (B), Vdovec (C) , Rozvedený (D).

-Druh materiálu, Kategorie nebo hodnoty: 1 = dřevo, 2 = kov, 3 = plast

-Způsob platby, Hodnoty nebo kategorie: (1) Hotovost, (2) debet, (3) převod, (4) kredit

V předchozích příkladech bylo číslo přidruženo ke každé kategorii zcela libovolně. 

Pak by se dalo předpokládat, že toto svévolné numerické sdružení je rovno a diskrétní kvantitativní proměnná, ale není tomu tak, protože s těmito čísly nelze provádět aritmetické operace.

Pro ilustraci myšlenky v proměnné Způsob platby, operace součtu nedává smysl:

 (1) Hotovost + (2) Debet nikdy se nebude rovnat (3) Převod

Klasifikace kategoriálních proměnných

Hodnocení je založeno na tom, zda mají implicitní hierarchii, nebo zda je počet možných výsledků více než dva nebo dva.

Kategorická proměnná s pouze jedním možným výsledkem není proměnná, jedná se o kategorickou konstantu.

Nominální kategorie 

Když nemohou být zastoupeni číslem nebo mají jakoukoli objednávku. Například proměnná: Materiál_typ, tmá nominální hodnoty (Dřevo, kov, plast), nemají žádnou hierarchii ani pořadí, i když je každé odpovědi nebo kategorii přiřazeno libovolné číslo.

Pořadové kategorické

Proměnná: Studijní výsledky

Jmenovité hodnoty: Vysoká, Střední, Nízká

Ačkoli hodnoty této proměnné nejsou číselné, mají implicitní pořadí nebo hierarchii.

Binární kategorie

Jedná se o nominální proměnné se dvěma možnými odpověďmi, například:

-Proměnná: Odpovědět

-Jmenovité hodnoty: Skutečný, Falešný

Všimněte si, že proměnná Odpovědět nemá implicitní hierarchii a má pouze dva možné výsledky, jedná se tedy o binární kategorickou proměnnou.

Někteří autoři tento typ nazývají binární proměnná, a nepovažuji to za součást kategorické proměnné které jsou omezeny na skupiny s více než třemi možnými kategoriemi.

Statistiky s kategorickými proměnnými

Statistiku lze provádět s kategorickými proměnnými, přestože nejde o numerické ani kvantitativní proměnné. Chcete-li například znát trend nebo nejpravděpodobnější hodnotu kategorické proměnné, vezměte si Móda.

Móda v tomto případě je to nejvíce opakovaný výsledek nebo hodnota kategorické proměnné. U kategorických proměnných není možné vypočítat ani průměr, ani medián.

Průměr nelze vypočítat, protože aritmetiku nelze provést s kategorickými proměnnými. Medián také není, protože kvantitativní nebo kategorické proměnné nemají pořadí ani hierarchii, takže není možné určit centrální hodnotu..

Grafické znázornění kategoriálních proměnných

Vzhledem k určité kategorické proměnné lze najít frekvenci nebo počet opakování výsledku této proměnné. Pokud je to provedeno pro každý výsledek, lze vytvořit graf četnosti pro každou kategorii nebo výsledek..

Zde je několik příkladů toho, jak lze kategorické proměnné graficky znázornit.

Vyřešená cvičení

Cvičení 1

Společnost má záznamy o datech 170 zaměstnanců. Jedna z proměnných, která je v těchto registrech, je: Rodinný stav. Tato proměnná má čtyři kategorie nebo možné hodnoty:

Singl (NA), Ženatý (B), Vdovec (C) , Rozvedený (D).

I když se jedná o nečíselnou proměnnou, je možné vědět, kolik z celkových záznamů je v určité kategorii a může být znázorněno ve formě sloupcového grafu, jak ukazuje následující obrázek:

Obrázek 2. Reprezentace výsledků kategorické proměnné. Zdroj: vlastní výroba

Příklad 2

Obchod s obuví sleduje své tržby. Mezi proměnnými, které spravují své záznamy, je barva obuvi pro každý model. Proměnná: 

Color_Shoe_Model_AW3

Je kategorický a má pět možných kategorií nebo hodnot. Pro každou kategorii této proměnné je celkový počet prodejů a je stanoveno jejich procento. Výsledky jsou uvedeny v grafu následujícího obrázku:

Obrázek 3. Kategorická proměnná Barva _Bota. V této proměnné je režim bílý. Zdroj: vlastní výroba.

Potom lze říci, že model boty AW3, který je v móda, ten, který se prodává nejčastěji, je Bílý, těsně následovaný Černá

Lze také říci, že s 70% pravděpodobností bude další prodaná obuv tohoto modelu Bílý nebo Černá.

Tyto informace mohou být užitečné pro obchod při zadávání nových objednávek, nebo dokonce mohou uplatnit slevy na nejméně prodávané barvy kvůli přebytečnému inventáři..

Příklad 3

U určité populace dárců krve chcete představovat počet lidí, kteří patří do určité krevní skupiny. Grafický způsob vizualizace výsledků je pomocí piktogramu, který je v pozadí tabulka.

První sloupec představuje proměnnou Krevní skupina a jeho možné výsledky nebo kategorie. Druhý sloupec má v ikonické nebo obrazové formě zastoupení počtu lidí v každé kategorii. V našem příkladu se jako ikona používá červená kapička, z nichž každá představuje 10 lidí.

Obrázek 4. Piktogram. Zdroj: vlastní výroba

Reference

  1. Khan Academy. Analýza kategorických údajů. Obnoveno z: khanacademy.org
  2. Vesmírné vzorce. Kvalitativní proměnná. Obnoveno z: univesoformulas.com
  3. Minitab. Které jsou kategorické, diskrétní a spojité proměnné. Obnoveno z: support.minitab.com
  4. Výukový program pro Excel. Charakterizace proměnných. Obnoveno z: help.xlslat.com.
  5. Wikipedia. Statistická proměnná. Obnoveno z wikipedia.com
  6. Wikipedia. Kategorická proměnná. Obnoveno z wikipedia.com
  7. Wikipedia. Kategorická proměnná. Obnoveno z wikipedia.com

Zatím žádné komentáře