Súčasný vývoj v oblasti psychologického hodnotenia zdôrazňuje zlepšovanie metodológie a význam zvyšovania efektívnosti. Algoritmy počítačového adaptívneho testovania (CAT) založené na teórii odpovede na položku (IRT) ponúkajú zaujímavé príležitosti pre súčasnú optimalizáciu ako presnosti, tak aj efektívnosti merania. Tento článok prezentuje zistenia 15 výskumných štúdií z oblasti testovania schopností, klinickej psychológie, testovania osobnosti a zdravotníckej starostlivosti zameraných na skúmanie reliability, užitočnosti (v zmysle úspory položiek) a validity (v zmysle korelácií s existujúcimi nástrojmi) CAT. Celkovo sú zistenia povzbudivé – CAT poskytuje efektívny prostriedok pre získanie optimálneho množstva informácie potrebnej pre zodpovedanie posudzovanej otázky, a to využitím minimálneho množstva času a/alebo počtu položiek pre získanie danej informácie. CAT skóre silno korelovalo so skóre z celej položkovej banky (rozpätie r = 0,83 – 0,99) a stredne silno so zaužívanými nástrojmi (rozpätie r = 0,58 – 0,83) poskytujúc dôkazy pre reliabilitu, validitu a porovnateľnosť adaptívnych nástrojov. Avšak tieto výsledky sú založené hlavne na CAT simulačných štúdiách a preto sú potrebné ďalšie štúdie zahŕňajúce administráciu skutočných testov živým respondentom, aby tieto zistenia potvrdili. and Computerized adaptive testing: precision, validity and efficiency
Present developments in the area of psychological assessment place emphasis on methodological improvements and the importance of increasing effectiveness. Computerized adaptive testing (CAT) algorithms based on item response theory (IRT) offer attractive opportunities for simultaneously optimizing both measurement precision and efficiency. This article presents findings of 15 research studies from field of ability testing, clinical psychology, personality testing and health care designed to explore the reliability, utility (in terms of item savings) and validity (in terms of correlations with existing tools) of CAT. Overall, the findings are encouraging – CAT provides an efective means to gain an optimal amount of information needed to answer an assessment question, while keeping time and/or number of items required to obtain that information at a minimum. CAT score correlated high with score from the full item bank (range r = 0,83 – 0,99) and moderately with established measures (range r = 0,58 – 0,83) provide the evidence for reliability, validity and comparability of adaptive tools. However, these results are based mainly on CAT simulation studies and therefore additional Live-CAT studies (involves the administration of real tests to live examinees) are needed to confirm this pattern of findings.