KonText
KonText je webová aplikace, která slouží k přístupu ke korpusům z repozitáře LINDAT/CLARIAH-CZ. Umožňuje vyhodnocení jednoduchých i složitých dotazů, zobrazení výsledků hledání ve formě konkordančních řádků, výpočet četností, výpočet asociačních měr pro kolokace a řadu dalších aktivit s jazykovými daty. Tato instance LINDAT/CLARIAH-CZ je větví (fork) aplikace KonText vytvořené Ústavem Českého národního korpusu a dále rozšiřované Ústavem formální a aplikované lingvistiky dle potřeb projektu LINDAT/CLARIAH-CZ.
Níže uvádíme obecného průvodce prohledáváním korpusů v KonTextu. K dispozici jsou i příklady hledání v konkrétních korpusech: CWC, HamleDT 3.0, PARSEME MWE, PDT, UD, and other corpora
Jak hledat v korpusu
1. Po výběru korpusu http://lindat.mff.cuni.cz/services/kontext/run.cgi/corplist můžete vybrat jiný korpus přes položku Korpus (Corpus):
2. Vyberte Typ dotazu (Query Type). Pokud chcete hledat slova/posloupnosti slov, vyberte Základní (Basic). Pokud chcete vytvářet složitější dotazy, vyberte CQL (zde je manuál k CQL https://www.sketchengine.co.uk/corpus-querying/#CorpusQueryLanguageCQL).
3. Pokud chcete zobrazit seznam atributů, vyberte Výchozí atribut (Default attribute). Pokud v dotazu pracujete s více atributy, nemusíte mezi nimi přepínat.
4. Pokud kladete dotaz na metadatové informace (např. id dokumentu, id věty atd. - metadatové informace jsou unikátní pro každý korpus LINDAT/CLARIAH-CZ), vyberte Formulujte dotaz s metadatovými informacemi (Specify query according to the meta-information)
Další informace o hledání v korpusech pomocí aplikace KonText jsou k dispozici anglicky a česky na stránce https://wiki.korpus.cz/doku.php/en:manualy:kontext:index, kde je aplikace popsána pro korpusy mimo LINDAT/CLARIAH-CZ, a proto specifické informace mohou být odlišné.