The vzorkování klastru Jedná se o typ metody vzorkování, která se používá, když jsou ve statistické populaci evidentní homogenní skupiny, ale jsou interně heterogenní. Často se používá při průzkumu trhu.
S touto metodou vzorkování provede výzkumník místo okamžitého výběru všech subjektů z celé populace několik kroků, aby shromáždil svůj vzorek populace. Nejprve výzkumník rozdělí celkovou populaci do samostatných skupin, nazývaných shluky. Poté vyberte jednoduchý náhodný vzorek populačních skupin. Nakonec provede svoji analýzu a odebere ukázková data těchto skupin.
U pevné velikosti náhodného vzorku je očekávaná chyba nižší, když je největší část variace v populaci přítomna interně v rámci skupin, a ne mezi skupinami..
Běžným důvodem pro použití klastrového vzorkování je snížit náklady zvýšením efektivity vzorkování. To se liší od stratifikovaného vzorkování, kde je motivem zvýšit přesnost..
Rejstřík článků
- Populace je rozdělena do N skupin, nazývaných shluky.
- Výzkumník náhodně vybere n skupin, aby je zahrnul do vzorku, kde n je menší než N.
- Každý prvek populace lze přiřadit jednomu a pouze jednomu klastru.
- V ideálním případě by populace v klastru měla být co nejvíce heterogenní, ale mezi klastry by měla existovat homogenita. Každý klastr musí být v malém měřítku reprezentací celkové populace.
K výběru klastrů, které mají být zahrnuty do studie, se v libovolném příslušném klastru používá technika náhodného výběru..
V jednostupňovém vzorkování klastru jsou do vzorku zahrnuty všechny prvky v každé z vybraných skupin..
Ve dvoustupňovém vzorkování klastrů je náhodně vybrána podmnožina prvků ve vybraných skupinách, které mají být zahrnuty do vzorku..
Mělo by se používat, pouze pokud je to ekonomicky opodstatněné, když snížení nákladů převáží ztrátu přesnosti. To je pravděpodobnější v následujících situacích.
Například nemusí být možné uvést seznam všech zákazníků řetězce hardwarových obchodů.
Bylo by však možné náhodně vybrat podmnožinu obchodů (fáze 1) a poté provést pohovor s náhodným vzorkem zákazníků, kteří tyto obchody navštívili (fáze 2)..
Například k provádění osobních rozhovorů se sestrami OR by mohlo mít smysl náhodně vybrat nemocnici ze vzorku nemocnic (fáze 1) a poté provést pohovor se všemi sestrami OR v dané nemocnici..
Pomocí vzorkování klastrů mohl tazatel provést mnoho rozhovorů za jediný den a v jedné nemocnici.
Naproti tomu jednoduchý náhodný výběr může vyžadovat, aby tazatel strávil celý den cestováním, aby provedl jeden pohovor v jedné nemocnici..
Může být levnější než jiné plány odběru vzorků, například nižší náklady na cestování a správu.
Tato metoda vzorkování bere v úvahu velké populace. Jelikož jsou tyto skupiny tak velké, implementace jakékoli jiné metody vzorkování by byla velmi nákladná.
U této metody je značně snížena velká obava ve výdajích, jako je cestování..
Například shromažďování informací z vyšetřování v každé domácnosti ve městě by bylo velmi nákladné, zatímco by bylo levnější shromažďovat informace v několika městských blocích. V takovém případě budou cesty výrazně sníženy.
Pokud jsou odhady brány v úvahu jakoukoli jinou metodou, je pozorována snížená variabilita výsledků. To nemusí být vždy ideální situace.
Pokud není k dispozici rámec vzorkování všech položek, lze použít pouze vzorkování clusteru.
Pokud má skupina ve vzorkované populaci zaujatý názor, znamená to, že celá populace má stejný názor. To nemusí být skutečný případ.
Existuje vyšší chyba vzorkování, kterou lze vyjádřit v tzv. „Designovém efektu“.
Ostatní pravděpodobnostní metody poskytují méně chyb než tato metoda. Z tohoto důvodu se nedoporučuje pro začátečníky.
Shlukové vzorkování se používá k odhadu vysoké úmrtnosti v případech, jako jsou války, hladomory a přírodní katastrofy..
Nevládní organizace chce založit vzorek dětí v pěti okolních městech, aby jim poskytla vzdělání.
Prostřednictvím jednostupňového vzorkování klastrů bude nevládní organizace schopna náhodně vybrat populace (skupiny) a vytvořit vzorek, který pomůže nevzdělaným dětem v těchto městech..
Majitel firmy se snaží zjistit statistickou výkonnost svých závodů, které jsou distribuovány v různých částech Spojených států..
Vezmeme-li v úvahu počet závodů, práci odvedenou v každém závodě a počet zaměstnanců na závod, odběr vzorků v jedné fázi by spotřeboval spoustu peněz a času..
Proto je rozhodnuto provést odběr vzorků ve dvou fázích. Majitel vytváří vzorky pracovníků z různých závodů, aby vytvořil klastry. Poté je rozdělte na velikost závodu v provozním stavu.
K zahájení výpočtů byl vytvořen dvoustupňový vzorkování klastru pomocí dalších technik shlukování, jako je například jednoduchý náhodný výběr vzorků..
Geografické vzorkování klastrů je jednou z nejčastěji implementovaných technik.
Každý klastr je geografická oblast. Vzhledem k tomu, že provedení průzkumu u geograficky rozptýlené populace může být nákladné, lze dosáhnout větší ekonomiky než při pouhém náhodném výběru vzorků seskupením různých respondentů do klastru v místní oblasti..
Obecně platí, že dosažení ekvivalentní přesnosti v odhadech vyžaduje zvýšení celkové velikosti vzorku, ale díky úsporám nákladů může být takové zvýšení velikosti vzorku proveditelné..
Například organizace hodlá provést průzkum, který by analyzoval výkon smartphonů v Německu..
Můžete rozdělit populaci celé země na města (klastry) a také vybrat města s nejvyšším počtem obyvatel. Filtrujte také ty, kteří používají mobilní zařízení.
Zatím žádné komentáře