Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Čapková, Dagmar,
Type:
text , edice , and články
Subject:
Literatura. Literární život , Komenský, Jan Amos, , komeniologie , deníky , edice deníků , české země 1620-1740 , and literatura, spisovatelé
Language:
English and Latin
Rights:
unknown
Creator:
Novotný, Vít , Luger, Kristýna , Štefánik, Michal , Vrabcová, Tereza , and Horák, Aleš
Publisher:
Masaryk University, Brno
Type:
text and corpus
Subject:
NER , named entity recognition , and Medieval
Language:
Czech , English , German , and Latin
Description:
This is an open dataset of sentences from 19th and 20th century letterpress reprints of documents from the Hussite era. The dataset contains a corpus for language modeling and human annotations for named entity recognition (NER).
Rights:
Public Domain Dedication (CC Zero) , http://creativecommons.org/publicdomain/zero/1.0/ , and PUB
Creator:
Novotný, Vít , Luger, Kristýna , Štefánik, Michal , Vrabcová, Tereza , and Horák, Aleš
Publisher:
Masaryk University, Brno
Type:
text and corpus
Subject:
NER , named entity recognition , and Medieval
Language:
Czech , English , German , and Latin
Description:
This is an open dataset of sentences from 19th and 20th century letterpress reprints of documents from the Hussite era. The dataset contains a corpus for language modeling and human annotations for named entity recognition (NER).
Rights:
Public Domain Dedication (CC Zero) , http://creativecommons.org/publicdomain/zero/1.0/ , and PUB
Creator:
Novotný, Vít , Seidlová, Kristýna , Vrabcová, Tereza , and Horák, Aleš
Publisher:
Masaryk University, Brno
Type:
image and corpus
Subject:
ocr , optical character recognition , language identification , image super-resolution , sr , and Medieval
Language:
German , Czech , Latin , and English
Description:
This is an open dataset of scanned images and OCR texts from 19th and 20th century letterpress reprints of documents from the Hussite era. The dataset contains human annotations for layout analysis, OCR evaluation, and language identification.
Rights:
Public Domain Dedication (CC Zero) , http://creativecommons.org/publicdomain/zero/1.0/ , and PUB
Creator:
Novotný, Vít and Horák, Aleš
Publisher:
Masaryk University, Brno
Type:
text and corpus
Subject:
ocr , optical character recognition , language identification , image super-resolution , sr , and Medieval
Language:
Czech , English , German , and Latin
Description:
These are supplementary materials for an open dataset of scanned images and OCR texts from 19th and 20th century letterpress reprints of documents from the Hussite era. The dataset contains human annotations for layout analysis, OCR evaluation, and language identification and is available at http://hdl.handle.net/11234/1-4615. These supplementary materials contain OCR texts from different OCR engines for book pages for which we have both high-resolution scanned images and annotations for OCR evaluation.
Rights:
Public Domain Dedication (CC Zero) , http://creativecommons.org/publicdomain/zero/1.0/ , and PUB
Creator:
Forster, Leonard,
Type:
text and články
Subject:
Rukopisy, prvotisky, staré tisky. Vzácná a pozoruhodná díla , Komenský, Jan Amos, , Opitz, Martin, , komeniologie , básníci němečtí , komeniana , edice korespondence , korespondence , české země 1620-1740 , Německo , světové dějiny 1492-1648 , and literatura, spisovatelé
Language:
English and Latin
Rights:
unknown
Creator:
Adámek, Jan,
Type:
text , prameny , and edice
Subject:
Křesťanství. Křesťanská církev všeobecně. Eklesiologie , Zajíc z Házmburka, Zbyněk, , Arnošt, , správa církevní , arcibiskupové pražští , knihy úřední , české země 1306-1419 , and církevní správa a hospodářství
Language:
Latin , Czech , and English
Description:
Chronologický přehled and Obálkový a hřbetní název: Archiv český
Rights:
unknown
Creator:
Stroh, Alfred Henry , Ekelöf, Greta , and Kungl. Svenska vetenskapsakademien
Publisher:
Almquist & Wiksell
Format:
print and 54 s.
Type:
model:monograph and TEXT
Subject:
Bibliografie. Katalogy , Swedenborg, Emanuel , 1688-1772 , 18. století , křesťanští teologové , křesťanští filozofové , Švédsko , 27-1-051 , 27-335 , (485) , 012 , 12 , and 01
Language:
English , Latin , and Swedish
Description:
compiled by Alfred H. Stroh and Greta Ekelöf. and KČSN
Rights:
http://creativecommons.org/publicdomain/mark/1.0/ and policy:public
Type:
text and sborníky jubilejní
Subject:
Křesťanská teologie. Dogmatická teologie , Rejchrtová, Noemi, , historici čeští , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , German , and Latin
Description:
Hřbetní název:Pocta Noemi Rejchrtové and Hřbetní název: Pocta Noemi Rejchrtové
Rights:
unknown
Creator:
Chromá, Martina,
Type:
text and monografie
Subject:
Rukopisy, prvotisky, staré tisky. Vzácná a pozoruhodná díla , Nový zákon , překlady , jazyk staroslověnský , jazyk církevněslovanský , světové dějiny středověku (do r. 1492) , and dějiny literatury, jazyka a knihy
Language:
English , Ancient Greek (to 1453) , and Latin
Rights:
unknown
Type:
text and monografie kolektivní
Subject:
Genealogie. Heraldika. Šlechta. Vlajky , Ferdinand , arcivévodové rakouští , místodržitelé , panovníci tyrolští , české země 1526-1620 , and panovníci, panovnické rody, dvory
Language:
English and Latin
Rights:
unknown
Type:
text and edice
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , listiny , and diplomatika, edice
Language:
Czech , German , Latin , and English
Rights:
unknown
Type:
text
Subject:
Dějiny civilizace. Kulturní dějiny , Preiss, Pavel, , historici umění , jubilea životní , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , German , and Latin
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Dějiny civilizace. Kulturní dějiny , Augustin Olomoucký, , humanisté , humanismus , kněží katoličtí , spisovatelé , české (československé) sborníky a kolektivní monografie , české země 1471-1526 , and literatura, spisovatelé
Language:
English , German , and Latin
Rights:
unknown
Creator:
Pavel Josef Šafařík and Jan Vilikovský
Publisher:
V generální komisi nakl. Melantrich and Nákladem Učené společnosti Šafaříkovy
Format:
print , text , regular print , and xxxvi, 467 s. : faksim. ; 25 cm
Type:
model:monograph and TEXT
Subject:
Slovenská literatura , 821.162.4-1 , 821.162.4-2 , (081.1) , 25 , and 821.162.4
Language:
Czech , English , German , and Latin
Description:
Pavel Josef Šafařík ; vydal Jan Vilikovský, 1000 výt., Obsahuje bibliografické odkazy a rejstřík, and Část. staročeský, anglický, německý a latinský text
Rights:
http://creativecommons.org/publicdomain/mark/1.0/ and policy:public
Creator:
Čeněk Zíbrt and Česká akademie císaře Františka Josefa pro vědy, slovesnost a umění
Publisher:
Nákladem České akademie císaře Františka Josefa pro vědy, slovesnost a umění
Format:
print , svazek , and 326 stran.
Type:
model:monograph and TEXT
Subject:
Vokální hudba , Bibliografie. Katalogy , české lidové písně , historické prameny , Česko , 784.4(=162.3) , (016) , (437.3) , 9 , 12 , 784 , and 01
Language:
Czech , English , French , German , Italian , Latin , Polish , and Russian
Description:
sestavil Čeněk Zíbrt., Obsahuje rejstříky., Částečně souběžný anglický, francouzský, německý, italský, latinský, polský a ruský text, and Vydává III. třída České akademie císaře Františka Josefa pro vědy, slovesnost a umění v Praze
Rights:
http://creativecommons.org/publicdomain/mark/1.0/ and policy:public
Creator:
Storchová, Lucie,
Type:
text and monografie
Subject:
Literatura. Literární život , humanismus , Univerzita Karlova , pravidla ediční , studenti , výuka univerzitní , české země 1526-1620 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
English and Latin
Rights:
unknown
Creator:
Boldan, Kamil,
Type:
text and monografie kolektivní
Subject:
Literatura. Literární život , kultura knižní , knihtisk , tiskaři , recepce antiky , humanismus , utrakvismus , české země 1437-1471 , české země 1471-1526 , české země 1526-1620 , and dějiny knihy, knihtisk, nakladatelství
Language:
English , Czech , and Latin
Rights:
unknown
Creator:
Vaculínová, Marta,
Type:
text and monografie kolektivní
Subject:
Literatura. Literární život , humanismus , život literární , překlady literární , vydavatelé , nakladatelé , zahraniční periodika a sborníky , české země 1471-1526 , and dějiny literatury, jazyka a knihy
Language:
English , Czech , Modern Greek (1453-) , and Latin
Rights:
unknown
Creator:
Tichý, Ondřej , Roček, Martin , Bočková, Renata , Čermák, Matěj , Dragounová, Jolana , Filipová, Helena , Gilová, Lucie , Hejná, Michaela , Hladíková, Lenka , Hladká, Alena , Hubinová, Veronika , Krajcsovicsová, Vlaďena , Kupková, Tatiana , Lebedeva, Tatiana , Malečková, Nikola , Novotná, Alena , Pazderová, Tereza , Popelíková, Jiřina , Rumlová, Jana , Tyčová Ocelík, Dana , Volná, Veronika , and Zahradníková, Tereza
Publisher:
Charles University, Faculty of Arts, Department of English Language and ELT Methodology
Type:
text , lexicon , and lexicalConceptualResource
Subject:
English , Old English , Anglo-Saxon , dictionary , Bosworth , Toller , lexicography , digitalization , English history , Mediaeval , and Medieval
Language:
English , Old English (ca. 450-1100) , Latin , Ancient Greek (to 1453) , and Ancient Hebrew
Description:
Description : This is an online edition of An Anglo-Saxon Dictionary, or a dictionary of "Old English". The dictionary records the state of the English language as it was used between ca. 700-1100 AD by the Anglo-Saxon inhabitants of the British Isles.
This project is based on a digital edition of An Anglo-Saxon dictionary, based on the manuscript collections of the late Joseph Bosworth (the so called Main Volume, first edition 1898) and its Supplement (first edition 1921), edited by Joseph Bosworth and T. Northcote Toller, today the largest complete dictionary of Old English (one day to be hopefully supplanted by the DOE). Alistair Campbell's "enlarged addenda and corrigenda" from 1972 are not public domain and are therefore not part of the online dictionary. Please see the front & back matter of the paper dictionary for further information, prefaces and lists of references & contractions.
The digitization project was initiated by Sean Crist in 2001 as a part of his Germanic Lexicon Project and many individuals and institutions have contributed to this project. Check out the original GLP webpage and the old Bosworth-Toller offline application webpage (to be updated). Currently the project is hosted by the Faculty of Arts, Charles University.
In 2010, the data from the GLP were converted to create the current site. Care was taken to preserve the typography of the original dictionary, but also provide a modern, user friendly interface for contemporary users.
In 2013, the entries were structurally re-tagged and the original typography was abandoned, though the immediate access to the scans of the paper dictionary was preserved.
Our aim is to reach beyond a simple digital edition and create an online environment dedicated to all interested in Old English and Anglo-Saxon culture. Feel free to join in the editing of the Dictionary, commenting on its numerous entries or participating in the discussions at our forums.
We hope that by drawing the attention of the community of Anglo-Saxonists to our site and joining our resources, we may create a more useful tool for everybody. The most immediate project to draw on the corrected and tagged data of the Dictionary is a Morphological Analyzer of Old English (currently under development).
We are grateful for the generous support of the Charles University Grant Agency and for the free hosting at the Faculty of Arts at Charles University. The site is currently maintained and developed by Ondrej Tichy et al. at the Department of English Language and ELT Methodology, Faculty of Arts, Charles University in Prague (Czech Republic).
Rights:
Creative Commons - Attribution 4.0 International (CC BY 4.0) , http://creativecommons.org/licenses/by/4.0/ , and PUB
Type:
corpus
Subject:
Germanistik
Language:
Chinese , Czech , English , French , German , Latin , and Spanish
Description:
Digital copies of historical botanic papers from the Missouri Botanical Garden Library; Bilddigitalisate von historischen botanischen Schriften; deutschsprachige Texte stellen nur einen Teilbereich dar
Rights:
Not specified
Creator:
Ciglbauer, Jan,
Type:
text , zápis hudby , prameny , and edice
Subject:
Církevní hudba. Duchovní hudba. Náboženská hudba , písně duchovní , liturgie , české země 1306-1526 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown
Creator:
Šedivá, Eliška,
Type:
text and katalogy
Subject:
Hudba , Bibliografie. Katalogy , Clam-Gallas, Kristian Filip, , Clam-Gallasové (rod) , hudebniny , sbírky hudební , archivy hudební , archivy rodové , české země 1740-1792 , české země 1792-1918 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown
Creator:
Šedivá, Eliška,
Type:
text and katalogy
Subject:
Hudba , Bibliografie. Katalogy , Clam-Gallas, Kristian Filip, , Clam-Gallasové (rod) , hudebniny , sbírky hudební , archivy hudební , archivy rodové , české země 1740-1792 , české země 1792-1847 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown
Creator:
Šedivá, Eliška,
Type:
text and katalogy
Subject:
Hudba , Bibliografie. Katalogy , Clam-Gallasové (rod) , Clam-Gallas, Kristian Filip, , hudebniny , sbírky hudební , archivy hudební , archivy rodové , české země 1740-1792 , české země 1792-1847 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown
Creator:
Šedivá, Eliška,
Type:
text and katalogy
Subject:
Hudba , Bibliografie. Katalogy , Clam-Gallasové (rod) , Clam-Gallas, Kristian Filip, , hudebniny , sbírky hudební , archivy hudební , archivy rodové , české země 1740-1792 , české země 1792-1847 , and hudba, tanec, hudební nástroje
Language:
Czech , English , Latin , and Multiple languages
Rights:
unknown
Creator:
Semerádová, Pavla
Type:
text , monografie , and katalogy
Subject:
Muzikologie. Dějiny hudby , kláštery , řád, premonstráti , život hudební , hudebniny , sbírky hudební , katalogy , české země 1526-1792 , české země 1792-1918 , hudba, tanec, hudební nástroje , and církevní řády a kongregace, náboženská bratrstva, kláštery
Language:
Czech , English , and Latin
Rights:
unknown
Creator:
Havránková, Lucie
Type:
text , monografie , and katalogy
Subject:
Církevní hudba. Duchovní hudba. Náboženská hudba , kostely farní , život hudební , sbírky hudební , hudba církevní , hudebniny , školy , kantoři , varhaníci , české země 1620-1740 , české země 1740-1792 , české země 1792-1918 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown
Publisher:
University College, Cork
Format:
application/tei+xml
Type:
corpus
Language:
English , Irish , and Latin
Description:
searchable online corpus of multilingual texts of Irish literature and history
Rights:
Not specified
Type:
text and monografie kolektivní
Subject:
Archeologie , archeologie, výzkumy , archeologie, nálezy , archeobotanika , geochemie , and archeologie
Language:
Czech , English , and Latin
Description:
300 výt.
Rights:
unknown
Type:
text and sborníky
Subject:
Pastorální teologie , kazatelé , kázání , homiletika , vztahy česko-polské , středověk , české (československé) sborníky a kolektivní monografie , české země 1306-1419 , české země 1419-1471 , teologie, ikonografie, zbožnost, hagiografie , Polsko , and světové dějiny středověku (do r. 1492)
Language:
Czech , Latin , English , German , and Polish
Description:
"Editoři Krzysztof Bracha, Martin Nodl"--Obálka, Na obálce nad názvem: Centre for Medieval Studies - CMS, and Bohemian-Polish Preaching Relations in the Middle Ages: Introductory Reflection.
Rights:
unknown
Type:
model:periodicalitem and TEXT
Language:
Czech , English , Latin , and Ukrainian
Description:
1
Rights:
http://creativecommons.org/licenses/by-nc-sa/4.0/ and policy:public
Type:
text , monografie kolektivní , and sborníky jubilejní
Subject:
Dějiny civilizace. Kulturní dějiny , Uhlíř, Zdeněk, , historici , dědictví kulturní , knihovníci , české (československé) sborníky a kolektivní monografie , and knihovnictví
Language:
Czech , English , German , Latin , and Polish
Description:
Obálkový název: Cesta k rozmanitosti
Rights:
unknown
Type:
text and monografie kolektivní
Subject:
Dějiny civilizace. Kulturní dějiny , Uhlíř, Zdeněk, , sborníky jubilejní , historici , dědictví kulturní , knihovníci , české (československé) sborníky a kolektivní monografie , teoretické a metodologické základy historie , and knihovnictví
Language:
Czech , English , German , Latin , and Polish
Description:
Obálkový název: Cesta k rozmanitosti
Rights:
unknown
Type:
text
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , Přemysl Otakar , panovníci , Zlatá bula sicilská (1212) , dějiny politické , diplomacie , české země od příchodu Slovanů do roku 1306 , and panovníci, panovnické rody, dvory
Language:
Czech , English , and Latin
Description:
Označení části na obálce a na hřbetu: 1, Text Pavol Černý ... [et al.], Vydáno u příležitosti stejnojmenné výstavy pořádané ve dnech 12.7.-12.9.2012 Ostravským muzeem ve spolupráci s Národním památkovým ústavem, územním odborným pracovištěm v Ostravě, Názvy příloh: Genealogie Přemyslovců, pět generací potomků knížete Břetislava I., Genealogie Štaufů, dvě generace potomků Fridricha I. Barbarossy, and Název části na obálce, hřbetu a v tiráži: Usilování o královskou korunu
Rights:
unknown
Type:
text
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , Přemysl Otakar , panovníci , Zlatá bula sicilská (1212) , dějiny politické , diplomacie , české země od příchodu Slovanů do roku 1306 , and panovníci, panovnické rody, dvory
Language:
Czech , English , and Latin
Description:
Označení části na obálce a na hřbetu: 1, Text Pavol Černý ... [et al.], Vydáno u příležitosti stejnojmenné výstavy pořádané ve dnech 12.7.-12.9.2012 Ostravským muzeem ve spolupráci s Národním památkovým ústavem, územním odborným pracovištěm v Ostravě, Názvy příloh: Genealogie Přemyslovců, pět generací potomků knížete Břetislava I., Genealogie Štaufů, dvě generace potomků Fridricha I. Barbarossy, and Název části na obálce, hřbetu a v tiráži: Usilování o královskou korunu
Rights:
unknown
Type:
text and sborníky jubilejní
Subject:
Lingvistika. Jazyky , Novotný, František, , filologie klasická , literatura anglická , jazyk latinský , antický svět , and české (československé) sborníky a kolektivní monografie
Language:
French , English , German , Latin , and Russian
Description:
Přeloženo z různých jazyků, 600 výtisků, and Ve sborníku jsou zastoupeny příspěvky z antické filologic. literární historie a výtvarného umění. Např.: nově objevené zlomky Aischylovy tragédie Glaukos Potnieus, etymologie slovesa venerari a počátky řecké karikatury. Tuto tematiku doplňují okrajové stati, např. o některých motivech antické fabulistiky u Jacka Londona.
Rights:
unknown
Type:
text and publikace informační
Subject:
Vysoké školy , Univerzita Karlova , listiny , insignie vysokoškolské , české země 1306-1419 , and školství, pedagogika, učitelé, péče o mládež
Language:
English and Latin
Description:
Z češtiny přeložil Jan Starý
Rights:
unknown
Type:
text and edice
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , Kálti, Márk, , kroniky uherské , rukopisy iluminované , edice , překlady , jazyk anglický , jazyk latinský , světové dějiny středověku (do r. 1492) , dějepisectví, historické vědy, historici , and rukopisy
Language:
English and Latin
Rights:
unknown
Creator:
Nováková, Julie,
Type:
text , edice , and články
Subject:
Fyzika , Komenský, Jan Amos, , komeniologie , fyzika , filozofie , edice , české země 1620-1740 , dějiny přírodních věd , and literatura, spisovatelé
Language:
English and Latin
Rights:
unknown
Type:
text , studie , and komentáře
Subject:
Středověká filozofie , Wycliffe, John, , <<z >>Pálče, Štěpán, , filozofie křesťanská , filozofie středověká , rukopisy středověké , reformátoři , vztahy česko-anglické , Velká Británie , světové dějiny středověku (do r. 1492) , teologie, ikonografie, zbožnost, hagiografie , rukopisy , and české země 1306-1419
Language:
Latin , English , and Czech
Description:
Commentarius in De universalibus Iohannis Wyclif Stephano de Palecz ascriptus and Obálkový a hřbetní název: Commentarius in De universalibus Iohannis Wyclif Stephano de Palecz ascriptus
Rights:
unknown
Creator:
Zeman, Daniel and Straka, Milan
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
tokenization , word segmentation , morphology , tagging , syntax , parsing , and universal dependencies
Language:
Afrikaans , Arabic , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Persian , Finnish , French , Old French (842-ca. 1400) , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Thai , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
CoNLL 2017 and 2018 shared tasks:
Multilingual Parsing from Raw Text to Universal Dependencies
This package contains the test data in the form in which they ware presented
to the participating systems: raw text files and files preprocessed by UDPipe.
The metadata.json files contain lists of files to process and to output;
README files in the respective folders describe the syntax of metadata.json.
For full training, development and gold standard test data, see
Universal Dependencies 2.0 (CoNLL 2017)
Universal Dependencies 2.2 (CoNLL 2018)
See the download links at http://universaldependencies.org/.
For more information on the shared tasks, see
http://universaldependencies.org/conll17/
http://universaldependencies.org/conll18/
Contents:
conll17-ud-test-2017-05-09 ... CoNLL 2017 test data
conll18-ud-test-2018-05-06 ... CoNLL 2018 test data
conll18-ud-test-2018-05-06-for-conll17 ... CoNLL 2018 test data with metadata
and filenames modified so that it is digestible by the 2017 systems.
Rights:
Licence Universal Dependencies v2.2 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.2 , and PUB
Creator:
Zeman, Daniel , Potthast, Martin , Straka, Milan , Popel, Martin , Dozat, Timothy , Qi, Peng , Manning, Christopher , Shi, Tianze , Wu, Felix G. , Chen, Xilun , Cheng, Yao , Björkelund, Anders , Falenska, Agnieszka , Yu, Xiang , Kuhn, Jonas , Che, Wanxiang , Guo, Jiang , Wang, Yuxuan , Zheng, Bo , Zhao, Huaipeng , Liu, Yang , Teng, Dechuan , Liu, Ting , Lim, Kyungtae , Poibeau, Thierry , Sato, Motoki , Manabe, Hitoshi , Noji, Hiroshi , Matsumoto, Yuji , Kırnap, Ömer , Önder, Berkay Furkan , Yuret, Deniz , Straková, Jana , Vania, Clara , Zhang, Xingxing , Lopez, Adam , Heinecke, Johannes , Asadullah, Munshi , Kanerva, Jenna , Luotolahti, Juhani , Ginter, Filip , Kuan, Yu , Sofroniev, Pavel , Schill, Erik , Hinrichs, Erhard , Nguyen, Dat Quoc , Dras, Mark , Johnson, Mark , Qian, Xian , Vilares, David , Gómez-Rodríguez, Carlos , Aufrant, Lauriane , Wisniewski, Guillaume , Yvon, François , Dumitrescu, Stefan Daniel , Boroş, Tiberiu , Tufiş, Dan , Das, Ayan , Zaffar, Affan , Sarkar, Sudeshna , Wang, Hao , Zhao, Hai , Zhang, Zhisong , Hornby, Ryan , Taylor, Clark , Park, Jungyeul , de Lhoneux, Miryam , Shao, Yan , Basirat, Ali , Kiperwasser, Eliyahu , Stymne, Sara , Goldberg, Yoav , Nivre, Joakim , Akkuş, Burak Kerim , Azizoglu, Heval , Cakici, Ruket , Moor, Christophe , Merlo, Paola , Henderson, James , Wang, Haozhou , Ji, Tao , Wu, Yuanbin , Lan, Man , de la Clergerie, Eric , Sagot, Benoît , Seddah, Djamé , More, Amir , Tsarfaty, Reut , Kanayama, Hiroshi , Muraoka, Masayasu , Yoshikawa, Katsumasa , Garcia, Marcos , and Gamallo, Pablo
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
dependency parser and parsebank
Language:
Arabic , Bulgarian , Russia Buriat , Czech , Catalan , Church Slavic , Danish , German , Modern Greek (1453-) , English , Spanish , Estonian , Basque , Persian , Finnish , French , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Swedish , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
This package contains the system outputs from the CoNLL 2017 Shared Task in Multilingual Parsing from Raw Text to Universal Dependencies.
Rights:
Licence Universal Dependencies v2.0 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.0 , and PUB
Creator:
Zeman, Daniel , Potthast, Martin , Duthoo, Elie , Mesnard, Olivier , Rybak, Piotr , Wróblewska, Alina , Che, Wanxiang , Liu, Yijia , Wang, Yuxuan , Zheng, Bo , Liu, Ting , Li, Zuchao , He, Shexia , Zhang, Zhuosheng , Zhao, Hai , Wu, Yingting , Tong, Jia-Jun , Nguyen, Dat Quoc , Verspoor, Karin , Wan, Hui , Naseem, Tahira , Lee, Young-Suk , Castelli, Vittorio , Ballesteros, Miguel , Hershcovich, Daniel , Abend, Omri , Rappoport, Ari , Smith, Aaron , Bohnet, Bernd , de Lhoneux, Miryam , Nivre, Joakim , Shao, Yan , Stymne, Sara , Kırnap, Ömer , Dayanık, Erenay , Yuret, Deniz , Kanerva, Jenna , Ginter, Filip , Miekka, Niko , Leino, Akseli , Salakoski, Tapio , Lim, KyungTae , Park, Cheoneum , Lee, Changki , Poibeau, Thierry , Bhat, Riyaz Ahmad , Bhat, Irshad , Bangalore, Srinivas , Qi, Peng , Dozat, Timothy , Zhang, Yuhao , Manning, Christopher , Boroș, Tiberiu , Dumitrescu, Stefan Daniel , Burtica, Ruxandra , Arakelyan, Gor , Hambardzumyan, Karen , Khachatrian, Hrant , Rosa, Rudolf , Mareček, David , Straka, Milan , Seker, Amit , More, Amir , Tsarfaty, Reut , Önder, Berkay Furkan , Gümeli, Can , Jawahar, Ganesh , Muller, Benjamin , Fethi, Amal , Martin, Louis , Villemonte de la Clergerie, Eric , Sagot, Benoît , Seddah, Djamé , Özateş, Şaziye Betül , Özgür, Arzucan , Gungor, Tunga , Öztürk, Balkız , Ji, Tao , Liu, Yufang , Wang, Yijun , Wu, Yuanbin , Lan, Man , Chen, Danlu , Lin, Mengxiao , Hu, Zhifeng , and Qiu, Xipeng
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
parsed data , conllu , and universal dependencies
Language:
Afrikaans , Arabic , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Persian , Finnish , French , Old French (842-ca. 1400) , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Thai , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
Test data parsed by systems submitted to the CoNLL 2018 UD parsing shared task.
Rights:
Licence Universal Dependencies v2.2 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.2 , and PUB
Publisher:
Trnavská univerzita,
Type:
sborníky jubilejní
Subject:
Právo , Blaho, Peter, , právo , dějiny práva , and zahraniční periodika a sborníky
Language:
Slovak , Czech , German , English , Latin , and Polish
Rights:
unknown
Type:
text , prameny , and edice
Subject:
Křesťanská sdružení, spolky a organizace. Řeholní řády , řád, jezuité , rukopisy , konsvetudináře , světové dějiny 1492-1648 , církve, sekty , české země 1620-1740 , and církevní řády a kongregace, náboženská bratrstva, kláštery
Language:
Czech , English , and Latin
Description:
Souběžná latinská tit. s.
Rights:
unknown
Creator:
Kosmas,
Type:
text and edice
Subject:
Dějiny Česka a Slovenska , Kosmas, , kronika Kosmova , edice , kronikáři , české země 895/906-1197 , and dějepisectví, historické vědy, historici
Language:
English and Latin
Description:
Přeloženo z latiny
Rights:
unknown
Creator:
Philomates, Václav,
Type:
text and prameny
Subject:
Hudební teorie , Philomates, Václav, , teorie hudební , hudba středověká , české země 1471-1526 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Description:
Vydáno ve spolupráci s Jihočeskou univerzitou v Českých Budějovicích a Nadací pro dějiny kultury ve střední Evropě
Rights:
unknown
Creator:
Řehoř
Type:
text , prameny , and edice
Subject:
Náboženská literatura. Duchovní literatura , Řehoř , homilie , papeži , překlady , jazyk církevněslovanský , teologie , teologie, ikonografie, zbožnost, hagiografie , české země 895/906-1197 , and literatura, spisovatelé
Language:
Czech , English , Latin , and Russian
Description:
Část. přeloženo z latiny
Rights:
unknown
Creator:
Řehoř
Type:
text , prameny , and edice
Subject:
Náboženská literatura. Duchovní literatura , Řehoř , homilie , papeži , překlady , jazyk církevněslovanský , teologie , teologie, ikonografie, zbožnost, hagiografie , české země 895/906-1197 , and literatura, spisovatelé
Language:
Czech , English , Latin , and Russian
Description:
Rozložená tit. s., Část. přeloženo z latiny, and Díl 2. k vydání připravil Václav Konzal za pomoci Františka Čajky
Rights:
unknown
Creator:
Kubeša, David and Straka, Milan
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
entity linking , NEL , NER , dataset , and knowledge base
Language:
Afrikaans , Arabic , Armenian , Basque , Belarusian , Bulgarian , Catalan , Chinese , Croatian , Czech , Danish , Dutch , English , Estonian , Finnish , French , Galician , German , Hebrew , Hindi , Hungarian , Indonesian , Irish , Italian , Japanese , Korean , Latin , Latvian , Lithuanian , Maltese , Marathi , Modern Greek (1453-) , Northern Sami , Norwegian Nynorsk , Persian , Polish , Portuguese , Romanian , Russian , Scottish Gaelic , Serbian , Slovak , Slovenian , Spanish , Swedish , Tamil , Telugu , Uighur , Ukrainian , Urdu , Vietnamese , and Wolof
Description:
We present DaMuEL, a large Multilingual Dataset for Entity Linking containing data in 53 languages. DaMuEL consists of two components: a knowledge base that contains language-agnostic information about entities, including their claims from Wikidata and named entity types (PER, ORG, LOC, EVENT, BRAND, WORK_OF_ART, MANUFACTURED); and Wikipedia texts with entity mentions linked to the knowledge base, along with language-specific text from Wikidata such as labels, aliases, and descriptions, stored separately for each language. The Wikidata QID is used as a persistent, language-agnostic identifier, enabling the combination of the knowledge base with language-specific texts and information for each entity. Wikipedia documents deliberately annotate only a single mention for every entity present; we further automatically detect all mentions of named entities linked from each document. The dataset contains 27.9M named entities in the knowledge base and 12.3G tokens from Wikipedia texts. The dataset is published under the CC BY-SA licence.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Type:
text and prameny
Subject:
Věda. Všeobecnosti. Základy vědy a kultury. Vědecká práce , Komenský, Jan Amos, , spisy , komeniana , zahraniční periodika a sborníky , české země 1620-1740 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Latin , Slovak , Czech , German , English , and Polish
Description:
"Zborník materiálov z medzinárodnej konferencie, konanej v Bratislave v dňoch 13. a 14. novembra 2000"--S. [1]
Rights:
unknown
Creator:
Zeman, Daniel and Droganova, Kira
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
semantic dependency and universal dependencies
Language:
Afrikaans , Assyrian Neo-Aramaic , Akkadian , Amharic , Arabic , Belarusian , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Mandarin Chinese , Coptic , Welsh , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Finnish , French , Irish , Gothic , Ancient Greek (to 1453) , Mbyá Guaraní , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Komi-Zyrian , Karelian , Latin , Latvian , Lithuanian , Literary Chinese , Marathi , Erzya , Dutch , Norwegian , Old Russian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Sanskrit , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Tamil , Tagalog , Turkish , Ukrainian , Urdu , Vietnamese , Warlpiri , Wolof , Yoruba , and Galician
Description:
Deep Universal Dependencies is a collection of treebanks derived semi-automatically from Universal Dependencies (http://hdl.handle.net/11234/1-2988). It contains additional deep-syntactic and semantic annotations. Version of Deep UD corresponds to the version of UD it is based on. Note however that some UD treebanks have been omitted from Deep UD.
Rights:
Licence Universal Dependencies v2.4 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.4 , and PUB
Creator:
Zeman, Daniel and Droganova, Kira
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
semantic dependency and universal dependencies
Language:
Afrikaans , Assyrian Neo-Aramaic , Akkadian , Amharic , Arabic , Belarusian , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Mandarin Chinese , Coptic , Welsh , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Finnish , French , Irish , Gothic , Ancient Greek (to 1453) , Mbyá Guaraní , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Komi-Zyrian , Karelian , Latin , Latvian , Lithuanian , Literary Chinese , Marathi , Erzya , Dutch , Norwegian , Old Russian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Sanskrit , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Tamil , Tagalog , Turkish , Ukrainian , Urdu , Vietnamese , Warlpiri , Wolof , Yoruba , Galician , Bhojpuri , Komi-Permyak , Livvi , Moksha , Scottish Gaelic , and Skolt Sami
Description:
Deep Universal Dependencies is a collection of treebanks derived semi-automatically from Universal Dependencies (http://hdl.handle.net/11234/1-3105). It contains additional deep-syntactic and semantic annotations. Version of Deep UD corresponds to the version of UD it is based on. Note however that some UD treebanks have been omitted from Deep UD.
Rights:
Licence Universal Dependencies v2.5 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.5 , and PUB
Creator:
Zeman, Daniel and Droganova, Kira
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
semantic dependency and universal dependencies
Language:
Afrikaans , Assyrian Neo-Aramaic , Akkadian , Amharic , Arabic , Belarusian , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Mandarin Chinese , Coptic , Welsh , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Finnish , French , Irish , Gothic , Ancient Greek (to 1453) , Mbyá Guaraní , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Komi-Zyrian , Karelian , Latin , Latvian , Lithuanian , Literary Chinese , Marathi , Erzya , Dutch , Norwegian , Old Russian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Sanskrit , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Tamil , Tagalog , Turkish , Ukrainian , Urdu , Vietnamese , Warlpiri , Wolof , Yoruba , Galician , Bhojpuri , Komi-Permyak , Livvi , Moksha , Scottish Gaelic , Skolt Sami , Icelandic , Albanian , and Persian
Description:
Deep Universal Dependencies is a collection of treebanks derived semi-automatically from Universal Dependencies (http://hdl.handle.net/11234/1-3226). It contains additional deep-syntactic and semantic annotations. Version of Deep UD corresponds to the version of UD it is based on. Note however that some UD treebanks have been omitted from Deep UD.
Rights:
Licence Universal Dependencies v2.6 , https://lindat.mff.cuni.cz/repository/xmlui/page/license-ud-2.6 , and PUB
Creator:
Zeman, Daniel and Droganova, Kira
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
semantic dependency and universal dependencies
Language:
Afrikaans , Assyrian Neo-Aramaic , Akkadian , Amharic , Arabic , Belarusian , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Mandarin Chinese , Coptic , Welsh , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Finnish , French , Irish , Gothic , Ancient Greek (to 1453) , Mbyá Guaraní , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Komi-Zyrian , Karelian , Latin , Latvian , Lithuanian , Literary Chinese , Marathi , Erzya , Dutch , Norwegian , Old Russian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Sanskrit , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Tamil , Tagalog , Turkish , Ukrainian , Urdu , Vietnamese , Warlpiri , Wolof , Yoruba , Galician , Bhojpuri , Komi-Permyak , Livvi , Moksha , Scottish Gaelic , Skolt Sami , Icelandic , Albanian , Persian , Akuntsu , Apurinã , Khunsari , Manx , Mundurukú , Nayini , Soi , South Levantine Arabic , and Tupinambá
Description:
Deep Universal Dependencies is a collection of treebanks derived semi-automatically from Universal Dependencies (http://hdl.handle.net/11234/1-3424). It contains additional deep-syntactic and semantic annotations. Version of Deep UD corresponds to the version of UD it is based on. Note however that some UD treebanks have been omitted from Deep UD.
Rights:
Licence Universal Dependencies v2.7 , https://lindat.mff.cuni.cz/repository/xmlui/page/license-ud-2.7 , and PUB
Creator:
Zeman, Daniel and Droganova, Kira
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
semantic dependency and universal dependencies
Language:
Afrikaans , Assyrian Neo-Aramaic , Akkadian , Amharic , Arabic , Belarusian , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Mandarin Chinese , Coptic , Welsh , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Finnish , French , Irish , Gothic , Ancient Greek (to 1453) , Mbyá Guaraní , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Komi-Zyrian , Karelian , Latin , Latvian , Lithuanian , Literary Chinese , Marathi , Erzya , Dutch , Norwegian , Old Russian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Sanskrit , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Tamil , Tagalog , Turkish , Ukrainian , Urdu , Vietnamese , Warlpiri , Wolof , Yoruba , Galician , Bhojpuri , Komi-Permyak , Livvi , Moksha , Scottish Gaelic , Skolt Sami , Icelandic , Albanian , Persian , Akuntsu , Apurinã , Khunsari , Manx , Mundurukú , Nayini , Soi , South Levantine Arabic , Tupinambá , Beja , Western Frisian , Urubú-Kaapor , Kangri , K'iche' , Low German , Makuráp , Western Armenian , and Central Siberian Yupik
Description:
Deep Universal Dependencies is a collection of treebanks derived semi-automatically from Universal Dependencies (http://hdl.handle.net/11234/1-3687). It contains additional deep-syntactic and semantic annotations. Version of Deep UD corresponds to the version of UD it is based on. Note however that some UD treebanks have been omitted from Deep UD.
Rights:
Licence Universal Dependencies v2.8 , https://lindat.mff.cuni.cz/repository/xmlui/page/license-ud-2.8 , and PUB
Creator:
Dávid, Ferenc,
Type:
text and prameny
Subject:
Latinská literatura, latinsky psaná , antitrinitarismus , myšlení náboženské , Maďarsko , církevní a náboženské dějiny , and světové dějiny 1492-1648
Language:
English and Latin
Rights:
unknown
Creator:
Magnin, Charles,
Type:
text and monografie
Subject:
Divadlo. Divadelní představení , divadlo loutkové , přehledná zpracování světových dějin (chronologicky) , and divadlo, film, fotografie
Language:
Czech , English , French , German , Italian , and Latin
Description:
Poznámky
Rights:
unknown
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Changes in version 1.1:
1. Universal Dependencies tagset instead of the older and smaller Google Universal POS tagset.
2. SVM classifier trained on Universal Dependencies 1.2 instead of HamleDT 2.0.
3. Balto-Slavic languages, Germanic languages and Romance languages were tagged by classifier trained only on the respective group of languages. Other languages were tagged by a classifier trained on all available languages. The "c7" combination from version 1.0 is no longer used.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Type:
text , faksimile , and komentáře
Subject:
Rukopisy, prvotisky, staré tisky. Vzácná a pozoruhodná díla , Hutský z Křivoklátu, Matěj, , Václav, , rukopisy , životy svatých , hagiografie , české země 1526-1620 , and teologie, ikonografie, zbožnost, hagiografie
Language:
German , English , and Latin
Description:
Faksimile částečně ve speciálním vydání se zlacením (číslováno I-IC) a částečně v normálním vydání (číslováno 1-381) and Obsahuje faksimile původního latinského rukopisu a jako součást komentáře i souběžný anglický a německý překlad
Rights:
unknown
Creator:
Komenský, Jan Amos,
Type:
text , spisy , edice , and monografie kolektivní
Subject:
Moderní západní filozofie , Komenský, Jan Amos, , myšlení filozofické , myšlení pedagogické , filozofie náboženská , pansofie , komeniana , universalismus , české země 1526-1620 , filozofie, filozofové , české země 1620-1740 , and teologie, ikonografie, zbožnost, hagiografie
Language:
Latin , Czech , and English
Description:
Obálkový název: J.A.K. and Hřbetní název: Opera omnia J.A.K.
Rights:
unknown
Creator:
Komenský, Jan Amos,
Type:
text , korespondence , and edice
Subject:
Věda. Všeobecnosti. Základy vědy a kultury. Vědecká práce , Biografie , Komenský, Jan Amos, , filozofové čeští , teologové evangeličtí , teologie křesťanská , pansofie , české země 1620-1740 , and jednotlivci (církevní dějiny)
Language:
Latin , Czech , and English
Rights:
unknown
Type:
text , prameny , and edice
Subject:
Křesťanská sdružení, spolky a organizace. Řeholní řády , řád, augustiniáni , kláštery , diplomatáře , české země 1306-1419 , and církevní řády a kongregace, náboženská bratrstva, kláštery
Language:
Latin , Czech , and English
Rights:
unknown
Creator:
Rábik, Vladimír,
Type:
text , prameny , and diplomatáře
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , listiny uherské , diplomatika , edice , rody šlechtické , šlechta, buržoazie, měšťanstvo, podnikatelé , Slovensko 1301-1526 , and diplomatika, edice
Language:
Slovak , Latin , and English
Rights:
unknown
Creator:
Rábik, Vladimír,
Type:
text , prameny , and diplomatáře
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , listiny uherské , diplomatika , edice , rody šlechtické , šlechta, buržoazie, měšťanstvo, podnikatelé , diplomatika, edice , and Slovensko 1301-1526
Language:
Slovak , Latin , and English
Description:
Obsahuje rejstříky
Rights:
unknown
Type:
text and monografie
Subject:
Praktická teologie. Morální teologie , edice , odpustky , právo církevní , papežství , prameny písemné , světové dějiny středověku (do r. 1492) , světové dějiny 1492-1648 , církevní právo, inkvizice , and papežství, církevní politika
Language:
English and Latin
Rights:
unknown
Type:
text and monografie
Subject:
Náboženství, mytologie, kulty , Šimon, , rukopisy latinské , rukopisy středověké , mytologie antická , and rukopisy
Language:
Latin , Czech , and English
Description:
300 výtisků
Rights:
unknown
Type:
text and sborníky
Subject:
Genealogie. Heraldika. Šlechta. Vlajky , dvory , rezidence , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , French , German , Latin , and Polish
Description:
Příspěvky z 2. kolokvia konaného 18.-19. října 2007, které uspořádal Historický ústav Akademie věd České republiky ve spolupráci s Archivem hlavního města Prahy a Ústavem českých dějin Filozofické fakulty Univerzity Karlovy
Rights:
unknown
Type:
text and sborníky
Subject:
Genealogie. Heraldika. Šlechta. Vlajky , dvory , rezidence , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , French , German , Latin , and Polish
Description:
Příspěvky z 2. kolokvia konaného 18.-19. října 2007, které uspořádal Historický ústav Akademie věd České republiky ve spolupráci s Archivem hlavního města Prahy a Ústavem českých dějin Filozofické fakulty Univerzity Karlovy
Rights:
unknown
Creator:
Krafl, Pavel,
Type:
text and monografie kolektivní
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , diplomatika , práce ediční , české (československé) sborníky a kolektivní monografie , and diplomatika, edice
Language:
Czech , English , German , and Latin
Description:
Chronologický přehled and The editorship and editions of medieval sources of a diplomatic nature at the dawn of the 21st century
Rights:
unknown
Creator:
Krafl, Pavel,
Type:
text and monografie kolektivní
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , diplomatika , práce ediční , české (československé) sborníky a kolektivní monografie , and diplomatika, edice
Language:
Czech , English , German , and Latin
Description:
Chronologický přehled and The editorship and editions of medieval sources of a diplomatic nature at the dawn of the 21st century
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Genealogie. Heraldika. Šlechta. Vlajky , Habsburkové (rod) , české (československé) sborníky a kolektivní monografie , Habsburská monarchie , světové dějiny 1492-1648 , and politické dějiny, politici
Language:
German , English , and Latin
Description:
Publikace obsahuje příspěvky ze stejnojmenného mezinárodního vědeckého sympozia konaného 13.-15. října 2008 v Českém Krumlově
Rights:
unknown
Type:
text and sborníky jubilejní
Subject:
Filologie , Dostálová, Růžena, , filologie klasická , byzantologie , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , French , German , Modern Greek (1453-) , Latin , Slovak , and Spanish
Rights:
unknown
Creator:
Mazalová, Lucie,
Type:
text and monografie
Subject:
Křesťanská teologie. Dogmatická teologie , Hus, Jan, , eschatologie , teologie křesťanská , teologie husitská , kázání , korespondence , české země 1306-1419 , and teologie, ikonografie, zbožnost, hagiografie
Language:
English , Czech , and Latin
Rights:
unknown
Type:
text and sborníky
Subject:
Latina , filologie klasická , texty , jazyk latinský , and zahraniční periodika a sborníky
Language:
English and Latin
Rights:
unknown
Type:
text and mapy
Subject:
Historická geografie , Fabricius, Pavel, , Komenský, Jan Amos, , mapy historické , kartografie historická , and historická kartografie, atlasy, staré mapy
Language:
Czech , English , German , and Latin
Description:
Název z disku, Texty Milan V. Drápela, and 60 barevných digitálních reprodukcí map Moravy J.A. Komenského a 6 map od P. Fabricia ze sbírek Komenského muzea v Přerově s podrobným popisem
Rights:
unknown
Creator:
Spěváček, Jiří,
Type:
text and faksimile
Subject:
Vysoké školy , Karel , univerzity české , listiny zakládací , české země 1306-1419 , and školství, pedagogika, učitelé, péče o mládež
Language:
English , Czech , French , Latin , German , Russian , and Spanish
Rights:
unknown
Creator:
Freemanová, Michaela,
Type:
text and katalogy
Subject:
Muzikologie. Dějiny hudby , řád, milosrdní bratři , sbírky hudební , hudebniny , konventy , archiválie , české a československé archivy, archivní fondy , přehledná zpracování dějin českých zemí (chronologicky) , církevní řády a kongregace, náboženská bratrstva, kláštery , and hudba, tanec, hudební nástroje
Language:
Latin , Czech , English , and German
Rights:
unknown
Publisher:
Böhlau,
Type:
sborníky konferenční
Subject:
Křesťanství. Křesťanská církev všeobecně. Eklesiologie , papežství , papeži , dějiny církevní , světové dějiny středověku (do r. 1492) , and papežství, církevní politika
Language:
German , English , French , Latin , and Spanish
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Světové dějiny , společnost středověká , církev středověká , and české (československé) sborníky a kolektivní monografie
Language:
German , English , and Latin
Rights:
unknown
Creator:
Benedikt z Nudožer, Vavřinec,
Publisher:
Ostravská univerzita,
Subject:
Benedikt z Nudožer, Vavřinec, , edice , gramatika , jazyk český , české země 1526-1620 , and jazyk, písmo
Language:
English , Latin , and Czech
Rights:
unknown
Creator:
Zeman, Daniel , Mareček, David , Mašek, Jan , Popel, Martin , Ramasamy, Loganathan , Rosa, Rudolf , Štěpánek, Jan , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
treebank , Stanford dependencies , Prague dependencies , harmonization , common annotation style , and Interset
Language:
Arabic , Bulgarian , Bengali , Catalan , Czech , Danish , German , Modern Greek (1453-) , English , Spanish , Estonian , Basque , Persian , Finnish , Ancient Greek (to 1453) , Hindi , Hungarian , Italian , Japanese , Latin , Dutch , Portuguese , Romanian , Russian , Slovak , Slovenian , Swedish , Tamil , Telugu , and Turkish
Description:
HamleDT 2.0 is a collection of 30 existing treebanks harmonized into a common annotation style, the Prague Dependencies, and further transformed into Stanford Dependencies, a treebank annotation style that became popular recently. We use the newest basic Universal Stanford Dependencies, without added language-specific subtypes.
Rights:
HamleDT 2.0 Licence Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-hamledt-2.0 , and ACA
Creator:
Zeman, Daniel , Mareček, David , Mašek, Jan , Popel, Martin , Ramasamy, Loganathan , Rosa, Rudolf , Štěpánek, Jan , and Žabokrtský, Zdeněk
Publisher:
Charles University
Type:
text and corpus
Subject:
annotated corpus , morphology , syntax , dependency , treebank , harmonized annotation , and common annotation style
Language:
Arabic , Basque , Bengali , Bulgarian , Catalan , Croatian , Czech , Danish , Dutch , English , Estonian , Finnish , French , German , Modern Greek (1453-) , Ancient Greek (to 1453) , Hebrew , Hindi , Hungarian , Indonesian , Irish , Italian , Japanese , Latin , Persian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Spanish , Swedish , Tamil , Telugu , and Turkish
Description:
HamleDT (HArmonized Multi-LanguagE Dependency Treebank) is a compilation of existing dependency treebanks (or dependency conversions of other treebanks), transformed so that they all conform to the same annotation style. This version uses Universal Dependencies as the common annotation style.
Update (November 1017): for a current collection of harmonized dependency treebanks, we recommend using the Universal Dependencies (UD). All of the corpora that are distributed in HamleDT in full are also part of the UD project; only some corpora from the Patch group (where HamleDT provides only the harmonizing scripts but not the full corpus data) are available in HamleDT but not in UD.
Rights:
HamleDT 3.0 License Terms , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-hamledt-3.0 , and PUB
Publisher:
Academia : and Jewish Museum in Prague,
Type:
monografie kolektivní
Subject:
Polygrafie. Vydavatelství a knižní obchod , tisky staré , hebraika , knihtisk , knihtiskaři , kultura knižní , kultura židovská , české země 1526-1792 , židovská věda, kultura a školství , české země 1792-1918 , dějiny knihy, knihtisk, nakladatelství , and staré tisky
Language:
English , German , Hebrew , and Latin
Description:
Přeloženo z češtiny
Rights:
unknown
Creator:
Pius
Type:
text , prameny , edice , and studie
Subject:
Dějiny zemí střední Evropy , Pius , kroniky středověké , dějiny české , české země 1437-1471 , and dějepisectví, historické vědy, historici
Language:
Czech , Latin , and English
Description:
Se souběž. tit. l. latinsky
Rights:
unknown
Creator:
Pius
Type:
text , prameny , edice , and studie
Subject:
Dějiny zemí střední Evropy , Pius , kroniky středověké , dějiny české , české země 1437-1471 , and dějepisectví, historické vědy, historici
Language:
Czech , Latin , and English
Description:
Se souběž. tit. l. latinsky
Rights:
unknown
Publisher:
Geodezie,
Type:
text and atlasy
Subject:
Geografie Česka a Slovenska, reálie, cestování , Mapy. Atlasy. Glóby , mapy historické , edice map , kartografie historická , fondy archivní , and historická kartografie, atlasy, staré mapy
Language:
German , Czech , English , French , and Latin
Description:
V textové části na vnitřní straně obálky historický vývoj mapování Moravy
Rights:
unknown
Publisher:
Geodezie,
Type:
text and atlasy
Subject:
Geografie Česka a Slovenska, reálie, cestování , Mapy. Atlasy. Glóby , mapy historické , edice map , kartografie historická , fondy archivní , and historická kartografie, atlasy, staré mapy
Language:
German , Czech , English , French , and Latin
Description:
V textové části na vnitřní straně obálky historický vývoj mapování Moravy
Rights:
unknown
Creator:
Trkovská, Dana
Type:
text and monografie
Subject:
Geometrie , matematika , geometrie , dějiny matematiky , světové dějiny 1789-1918 , světové dějiny od r. 1918 do současnosti , and matematika, kybernetika
Language:
Czech , English , French , German , Ancient Greek (to 1453) , Italian , and Latin
Description:
Nad názvem: katedra didaktiky matematiky MFF UK
Rights:
unknown
Publisher:
Knihovna AV ČR, v.v.i.,
Type:
sborníky jubilejní
Subject:
Dějiny civilizace. Kulturní dějiny , Bibliografie. Katalogy , Hejnic, Josef, , humanismus , dějiny knihoven , dějiny knihtisku , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , German , and Latin
Rights:
unknown
Type:
text and sborníky jubilejní
Subject:
Dějiny civilizace. Kulturní dějiny , Bibliografie. Katalogy , Hejnic, Josef, , humanismus , dějiny knihoven , dějiny knihtisku , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , German , and Latin
Rights:
unknown
Type:
text and sborníky jubilejní
Subject:
Dějiny Česka a Slovenska , Šmahel, František, , husitství , reformace , renesance , dějiny české , dějiny evropské , české (československé) sborníky a kolektivní monografie , české země 1306-1526 , přehledná zpracování (tematicky) , and světové dějiny středověku (do r. 1492)
Language:
Czech , English , French , German , Polish , and Latin
Description:
Souběžná anglická titulní strana and Z technických důvodů vydáno ve 3 svazcích
Rights:
unknown
Creator:
Holeton, David,
Subject:
liturgie , rukopisy , utrakvismus , světové dějiny středověku (do r. 1492) , teologie, ikonografie, zbožnost, hagiografie , and české země 1306-1526
Language:
English and Latin
Rights:
unknown
Type:
text and monografie kolektivní
Subject:
Geologie. Meteorologie. Klimatologie , Mag z Maggu, František Alois, , Kiesswetter, Aloys Ferdinand, , Gaar, Josef, , Beck, Felix, , meteorologie , měření meteorologická , počasí , klimatologie historická , vědy o neživé přírodě, přírodní prostředí, astronomie , and české země 1740-1792
Language:
English , Latin , and German
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Křesťanství. Křesťanská církev všeobecně. Eklesiologie , Jakoubek, , sborníky konferenční , teologové , utrakvismus , reformace , kázání , jednotlivci (církevní dějiny) , české (československé) sborníky a kolektivní monografie , české země 1306-1419 , and české země 1419-1471
Language:
Czech , English , and Latin
Description:
Pod názvem: Centrum medievistických studií and Sborník obsahuje rozšířené verze příspěvků z kolokvia Jakoubek ze Stříbra: texty a jejich působení, konaného 21.1.2005
Rights:
unknown
Creator:
Komenský, Jan Amos,
Type:
text , korespondence , and edice
Subject:
Literatura. Literární život , Komenský, Jan Amos, , Kinner, Cyprián, , komeniologie , české země 1620-1740 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Polish , English , and Latin
Description:
Pod názvem: Sheffield-Warszawa-Leszno and Korespondence Jana Amose Komenského s Cyprianem Kinnerem z Elblagu z let 1642-1648.
Rights:
unknown
Creator:
Kolár, Jaroslav,
Type:
text , kancionály , and edice
Subject:
Církevní hudba. Duchovní hudba. Náboženská hudba , graduály , rukopisy liturgické , dějiny hudby , hudba církevní , písně duchovní , rukopisy , české země 1419-1471 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Description:
"MS. Praha, Knihovna Národního muzea, II C 7" and Souběžný název: Jistebnice kancionál : critical edition. Volume 1, Graduale
Rights:
unknown
Type:
text , kancionály , and edice
Subject:
Církevní hudba. Duchovní hudba. Náboženská hudba , graduály , rukopisy liturgické , hudba církevní , písně duchovní , rukopisy , české země 1419-1471 , and hudba, tanec, hudební nástroje
Language:
Czech , English , and Latin
Rights:
unknown