Tato studie sleduje čtenářské profily dětí z 1. a 4. ročníku základních škol s vývojovou dysfázií. V návaznosti na předchozí výzkum testuje předpoklad, že čtenářské výkony dětí s vývojovou dysfázií jsou signifikantně horší ve srovnání s výkony stejně starých vrstevníků, a to jak v rovině elementárního čtení, tak v rovině porozumění čtenému. V souladu s teoretickými poznatky /zejména tzv. Jednoduchý model čtení (Gough & Tunmer, 1986)/ ověřuje předpoklad, že obtíže dysfatických dětí se výrazně manifestují v oblasti porozumění čtenému i v oblasti dekódování (techniky čtení). Na studii participovalo 67 dětí s vývojovou dysfázií ze speciálních a základní škol a 253 běžně se vyvíjejících dětí ze základních škol. Dětem byla administrována baterie testů zaměřená na komplexní hodnocení čtenářských dovedností a na posouzení jazykových schopností souvisejících s vývojem čtenářství. Výsledky studie prokazují statisticky významně slabší výkony dysfatických dětí v prvních ročnících pouze v oblasti porozumění jazyku, konkrétně v úloze porozumění slyšenému textu. Ve čtvrtém ročníku se pak statisticky významné rozdíly ve prospěch běžně se vyvíjejících dětí objevují ve všech administrovaných čtenářských úlohách – tedy tam, kde je hodnocena přesnost čtení i porozumění čtenému. Zvláštní pozornost je věnována charakteristice deficitů starších dětí s vývojovou dysfázií v oblasti dekódování a porozumění čtenému. and The study is focused on investigating the reading profiles in both 1st grade and 4th grade children with specific language impairment (SLI). According to the previous research, it tests the assumption that the reading performance of children with SLI is significantly worse compared to the age control group at the level of reading speed and fluency, and at the level of reading comprehension. Based on the theoretical framework, (namely “The Simple View of Reading“– Gough & Tunmer 1986), it verifies the hypothesis that the difficulties of the SLI children are manifested both in the area of reading comprehension, and of decoding (reading technique). 67 children with SLI and 253 children with typical development of language skills participated in our study. We administered a battery of tests assessing reading skills and language skills which are related to the reading development. The results of our study only showed significant differences in the area of the language comprehension (namely in the test of the listening comprehension) in the 1st grade children. There are significant differences in all tests assessing both reading accuracy and reading comprehension between SLI children and the age control group in the 4th grade. The size of reading fluency and reading comprehension deficits in SLI fourth grade children is discussed in more details.
The Czech translation of SQuAD 2.0 and SQuAD 1.1 datasets contains automatically translated texts, questions and answers from the training set and the development set of the respective datasets.
The test set is missing, because it is not publicly available.
The data is released under the CC BY-NC-SA 4.0 license.
If you use the dataset, please cite the following paper (the exact format was not available during the submission of the dataset): Kateřina Macková and Straka Milan: Reading Comprehension in Czech via Machine Translation and Cross-lingual Transfer, presented at TSD 2020, Brno, Czech Republic, September 8-11 2020.
LiFR-Law is a corpus of Czech legal and administrative texts with measured reading comprehension and a subjective expert annotation of diverse textual properties based on the Hamburg Comprehensibility Concept (Langer, Schulz von Thun, Tausch, 1974). It has been built as a pilot data set to explore the Linguistic Factors of Readability (hence the LiFR acronym) in Czech administrative and legal texts, modeling their correlation with actually observed reading comprehension. The corpus is comprised of 18 documents in total; that is, six different texts from the legal/administration domain, each in three versions: the original and two paraphrases. Each such document triple shares one reading-comprehension test administered to at least thirty readers of random gender, educational background, and age. The data set also captures basic demographic information about each reader, their familiarity with the topic, and their subjective assessment of the stylistic properties of the given document, roughly corresponding to the key text properties identified by the Hamburg Comprehensibility Concept.
LiFR-Law is a corpus of Czech legal and administrative texts with measured reading comprehension and a subjective expert annotation of diverse textual properties based on the Hamburg Comprehensibility Concept (Langer, Schulz von Thun, Tausch, 1974). It has been built as a pilot data set to explore the Linguistic Factors of Readability (hence the LiFR acronym) in Czech administrative and legal texts, modeling their correlation with actually observed reading comprehension. The corpus is comprised of 18 documents in total; that is, six different texts from the legal/administration domain, each in three versions: the original and two paraphrases. Each such document triple shares one reading-comprehension test administered to at least thirty readers of random gender, educational background, and age. The data set also captures basic demographic information about each reader, their familiarity with the topic, and their subjective assessment of the stylistic properties of the given document, roughly corresponding to the key text properties identified by the Hamburg Comprehensibility Concept.
Changes to the previous version and helpful comments
• File names of the comprehension test results (self-explanatory)
• Corrected one erroneous automatic evaluation rule in the multiple-choice evaluation (zahradnici_3,
TRUE and FALSE had been swapped)
• Evaluation protocols for both question types added into Folder lifr_formr_study_design
• Data has been cleaned: empty responses to multiple-choice questions were re-inserted. Now, all surveys
are considered complete that have reader’s subjective text evaluation complete (these were placed at
the very end of each survey).
• Only complete surveys (all 7 content questions answered) are represented. We dropped the replies of
six users who did not complete their surveys.
• A few missing responses to open questions have been detected and re-inserted.
• The demographic data contain all respondents who filled in the informed consent and the demographic
details, with respondents who did not complete any test survey (but provided their demographic
details) in a separate file. All other data have been cleaned to contain only responses by the regular
respondents (at least one completed survey).
Corpus of Czech educational texts for readability studies, with paraphrases, measured reading comprehension, and a multi-annotator subjective rating of selected text features based on the Hamburg Comprehensibility Concept
Corpus of Czech educational texts for readability studies, with paraphrases, measured reading comprehension, and a multi-annotator subjective rating of selected text features based on the Hamburg Comprehensibility Concept
Experimental materials, data and R scripts used in the paper "Garden-path sentences and the diversity of their
(mis)representations" (Ceháková - Chromý, 2023).
Schopnost dobře číst ovlivňuje další oblasti života, jako je průběh vzdělávání a profesní uplatnění a zasahuje rovněž do osobnostní roviny člověka, včetně jeho sebepojetí. Mnohé aktuální empirické studie tvrdí, že přibližně pětina až čtvrtina žáků má problémy se čtením, respektive s dosaženou úrovní čtenářské gramotnosti. Současně pouze u části těchto dětí je diagnostikována specifická porucha učení či specifická porucha řeči a jazyka, které by jejich obtíže relevantně vysvětlily. V zahraniční odborné literatuře je fenoménu slabého čtenáře věnována adekvátní pozornost, jak v rovině výzkumné, tak i v oblasti tvorby konkrétních didaktických i poradenských programů pro cílenou intervenci. V českém kontextu jde stále o problematiku velmi marginalizovanou. Pojem „slabí čtenáři“ v obecné rovině zpravidla zahrnuje všechny čtenáře, kteří mají potíže s technikou čtení (dekódováním) a/nebo s porozuměním textu. V našem pojetí akcentujeme zejména rovinu porozumění, která se rozvíjí na základě vnitřních dispozic dítěte i environmentálních vlivů. Tato přehledová studie si klade za cíl zmapovat dosavadní stav zkoumaného konceptu, kriticky analyzovat fenomén slabého čtenáře. V terminologickém exkurzu vycházíme z jednoduchého modelu čtení (Gough, Tunmer, 1986), který považujeme v tomto kontextu za inspirativní. Na základě specifikace jednotlivých subskupin ilustrujeme charakteristiky slabých čtenářů, kategorizujeme je a diferencujeme. Komparací relevantních výzkumných šetření a následně i vlastního výzkumného designu chceme posunout současnou percepci slabého čtenáře a navrhnout model screeningu, identifikace a diagnostiky, který by mohl být inspirativní pro školský poradenský systém. and The ability to read well affects the results in other areas of life such as the educational and career opportunities and also extends into personality of a man including his self-esteem. Many current empirical studies claim that about a fifth to a quarter of pupils have reading problems, exactly with the level of literacy. At the same time only a part of these students are diagnosed with specific learning disabilities or specific disorders of speech and language, which would explain their difficulties. In the foreign literature is the phenomenon of poor readers is being paid adequate attention, both in terms of research as well as in the creation of specific teaching and counseling programs for targeted intervention. In the Czech context, the issue is still very marginalized. The term "poor readers" habitually includes all the readers who have difficulties with the technique of reading (decoding) and / or comprehension of the text. In our approach we emphasize the particular level of understanding which develops on the basis of the child's internal layout and external influences. We are inspired by the simple view of reading (Gough, Tunmer, 1986). This overview study aims to critically analyze the phenomenon of poor readers on the basis of individual subgroups to illustrate the characteristics of poor readers, differentiate and categorize them. By the comparison of the relevant research and the investigation design we want to shift the current perception of poor readers and propose a model of identification and diagnosis, which could be inspiring for the school counseling system.