Spolehlivost a konzistence v psychometrii

Když voláme někoho nebo něco spolehlivého, myslíme, že jsou konzistentní a spolehliví. Spolehlivost je také důležitou součástí dobrého psychologického testu. Koneckonců, test by nebyl velice cenný, kdyby byl nekonzistentní a kdyby vždy produkoval různé výsledky. Jak psychologové definují spolehlivost? Jaký vliv má na psychologické testování?

Spolehlivost znamená soudržnost opatření. Test se považuje za spolehlivý, pokud opakovaně získáme stejný výsledek. Pokud je například test určen ke změření vlastností (například introversionu ), pak při každém podání testu subjektu by výsledky měly být přibližně stejné. Bohužel nelze přesně vypočítat spolehlivost, ale lze ji odhadnout různými způsoby.

Zkušební test - spolehlivost

Testovatelnost a oprava spolehlivosti je měřítkem konzistence psychologického testu nebo hodnocení. Tento druh spolehlivosti se používá k určení konzistence testu v průběhu času. Zkušební a retestní spolehlivost se nejlépe používá pro věci, které jsou v čase stabilní, například inteligence .

Testovatelnost a retestová spolehlivost se měří testováním dvakrát ve dvou různých časových okamžicích. Tento typ spolehlivosti předpokládá, že nedojde ke změně kvality nebo konstrukce, která se měří.

Ve většině případů bude spolehlivost vyšší, když mezi testy proběhne jen málo času.

Metoda test-retest je jen jedním ze způsobů, které lze použít k určení spolehlivosti měření. Jiné techniky, které lze použít, zahrnují spolehlivost inter-rateru, vnitřní konzistenci a spolehlivost paralelních tvarů.

Je důležité si uvědomit, že spolehlivost testu-retestu se vztahuje pouze na konzistenci testu, ne nutně na platnost výsledků.

Spolehlivost interradera

Tento typ spolehlivosti se hodnotí tím, že dva nebo více nezávislých rozhodčích vyhodnotí test. Hodnoty jsou potom porovnány, aby se zjistila konzistence odhadu hodnocení.

Jedním ze způsobů, jak prověřit spolehlivost interradera, je, aby každý hodnotitel přiřadil každé testované položce skóre. Například každý hodnotitel by mohl skóre bodů na stupnici od 1 do 10. Dále byste vypočítali vzájemnou korelaci mezi těmito dvěma hodnoceními, abyste zjistili úroveň spolehlivosti interretera.

Dalším prostředkem pro testování spolehlivosti interretera je, aby hodnotitelé zjistili, do které kategorie spadá každé pozorování, a pak vypočítá procento dohody mezi hodnotiteli. Pokud se tedy hodnotitelé dohodnou 8 z desetikrát, test má míru spolehlivosti 80%.

Spolehlivost paralelních formulářů

Spolehlivost paralelních formulářů se měří porovnáním dvou různých testů, které byly vytvořeny s použitím stejného obsahu. Toho je dosaženo vytvořením velkého množství testovacích položek, které měří stejnou kvalitu a poté náhodně rozdělí položky na dva samostatné testy. Tyto dva testy by pak měly být podány současně stejným subjektům.

Interní spolehlivost konzistence

Tato forma spolehlivosti se používá k posouzení konzistence výsledků mezi položkami stejného testu. V podstatě porovnáváte testované položky, které měří stejný konstrukt, aby se určila vnitřní konzistence testů. Když uvidíte otázku, která se velmi podobá jiné otázce, může to znamenat, že dvě otázky jsou používány k měření spolehlivosti. Vzhledem k tomu, že obě otázky jsou podobné a mají měřit stejnou věc, měl by zkušební pracovník odpovědět na obě otázky stejně, což by znamenalo, že test má vnitřní konzistenci.

Faktory, které mohou ovlivnit spolehlivost

Existuje řada různých faktorů, které mohou mít vliv na spolehlivost opatření.

Nejprve a možná zřejmě je důležité, aby věc, která se měří, byla poměrně stabilní a konzistentní. Pokud je měřená proměnná něco, co se pravidelně mění, výsledky testu nebudou konzistentní.

Aspekty testovací situace mohou také mít vliv na spolehlivost. Pokud je například test prováděn v místnosti, která je extrémně horká, mohou být respondenti rozptýleni a nejsou schopni dokončit test podle svých nejlepších schopností. To může mít vliv na spolehlivost opatření. Další věci jako únava, stres, nemoc, motivace, špatné pokyny a rozptýlení okolního prostředí mohou také poškodit spolehlivost.

Spolehlivost vs. platnost

Je důležité si uvědomit, že právě proto, že test má spolehlivost, neznamená to, že má platnost. Platnost znamená, zda test skutečně měří, co tvrdí, že měří. Myslete na spolehlivost jako měřítko přesnosti a platnosti jako měřítka přesnosti. V některých případech může být test spolehlivý, ale neplatný. Představte si například, že uchazeči o zaměstnání zkoušejí, zda mají určitou osobnost . Zatímco test by mohl přinášet konzistentní výsledky, nemusí skutečně měřit charakter, který má měřit.