Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Dutch , Norwegian , Polish , Portuguese , Russian , Slovenian , Somali , Spanish , Swahili (macrolanguage) , Swedish , Tagalog , Thai , Turkish , Ukrainian , Undetermined , and Vietnamese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Public Domain Mark (PD) , http://creativecommons.org/publicdomain/mark/1.0/ , and PUB
Creator:
Jan Patočka
Publisher:
Str. 105–133. Stať. [České přepracování nevydané německé přednášky Die tschechiche Philosophie und ihre gegenwärtige Phase, kterou J. Patočka přednesl 6. 2. 1968 na universitě ve Freiburgu.]
Type:
Text
Subject:
1969 , cs , es , hu , and it
Language:
Czech , Italian , Hungarian , and Spanish
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Creator:
Adam, Čestmír,
Publisher:
ČNR ve vyd. ČTK-Pressfoto,
Type:
publikace obrazové
Subject:
Dějiny Česka a Slovenska , parlament , parlamentarismus , přehledná zpracování dějin českých zemí (chronologicky) , and dějiny správy
Language:
Czech , English , French , and Spanish
Rights:
unknown
Creator:
Kašpar, Oldřich,
Type:
text and monografie
Subject:
Španělská literatura, španělsky psaná (o ní) , literatura španělská , překlady , vztahy česko-španělské , hispanika , fondy knihovní , Španělsko , literatura, spisovatelé , české země 1526-1792 , světové dějiny novověku (1492-1918) , and české a československé knihovny, knižní fondy
Language:
Czech and Spanish
Rights:
unknown
Creator:
Uličný, Miloslav,
Type:
text and monografie
Subject:
Španělská literatura, španělsky psaná (o ní) , Cervantes Saavedra, Miguel de, , literatura španělská , romány rytířské , překlady literární , jazyk český , adaptace , české země 1848-1918 , Československo 1918-1992 , české země od r. 1993 do současnosti , and literatura, spisovatelé
Language:
Czech and Spanish
Description:
Vydáno u příležitosti čtyřstého výročí úmrtí Miguela de Cervantese Saavedra
Rights:
unknown
Creator:
Barteček, Ivo,
Type:
text , studie , and dokumenty
Subject:
Vnitropolitický vývoj, politický život , emigrace politická , emigrace německá , antifašisté němečtí , vztahy německo-mexické , perzekuce, politická emigrace , světové dějiny 1918-1945 , světové dějiny 1939-1945 , Mexiko , migrace, vystěhovalectví, kolonizace , and Československo 1918-1938
Language:
Czech , Spanish , and German
Description:
Text studie česky, dokumenty španělsky a německy, 200 výtisků, and "Centrum pro československá exilová studia, Filozofická fakulta Univerzity Palackého, Olomouc" -- Patit. s., obálka a tiráž
Rights:
unknown
Creator:
Barteček, Ivo,
Type:
text and monografie
Subject:
Vnitropolitický vývoj, politický život , emigrace politická , emigrace německá , antifašisté němečtí , vztahy německo-mexické , Mexiko , perzekuce, politická emigrace , Československo 1918-1938 , světové dějiny 1918-1945 , migrace, vystěhovalectví, kolonizace , and světové dějiny 1939-1945
Language:
Czech , Spanish , and German
Description:
Text studie česky, dokumenty španělsky a německy and "Centrum pro československá exilová studia, Filozofická fakulta Univerzity Palackého, Olomouc" -- Patit. s., obálka a tiráž
Rights:
unknown
Creator:
Jan Patočka
Publisher:
Filosofický časopis 17 (1969), č. 5–6, str. 682–702. Stať. [Od str. 695 se text shoduje s doslovem k 2. vyd. Přirozeného světa, srv. 1970/10.]
Type:
Text
Subject:
1969 , 1980/1 , 1988/29 , 1991/2 , 2004/10 , 2009/1 , AS/PD-1 , cs , de , es , fr , fulltext , hu , SS–7/Fen–II , and Stať.
Language:
Czech , French , Hungarian , German , and Spanish
Rights:
open access and Rights holder: Archiv Jana Patočky, z.s.
Creator:
Zeman, Daniel and Straka, Milan
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
tokenization , word segmentation , morphology , tagging , syntax , parsing , and universal dependencies
Language:
Afrikaans , Arabic , Breton , Bulgarian , Russia Buriat , Catalan , Czech , Church Slavic , Danish , German , Modern Greek (1453-) , English , Estonian , Basque , Faroese , Persian , Finnish , French , Old French (842-ca. 1400) , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Nigerian Pidgin , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Spanish , Serbian , Swedish , Thai , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
CoNLL 2017 and 2018 shared tasks:
Multilingual Parsing from Raw Text to Universal Dependencies
This package contains the test data in the form in which they ware presented
to the participating systems: raw text files and files preprocessed by UDPipe.
The metadata.json files contain lists of files to process and to output;
README files in the respective folders describe the syntax of metadata.json.
For full training, development and gold standard test data, see
Universal Dependencies 2.0 (CoNLL 2017)
Universal Dependencies 2.2 (CoNLL 2018)
See the download links at http://universaldependencies.org/.
For more information on the shared tasks, see
http://universaldependencies.org/conll17/
http://universaldependencies.org/conll18/
Contents:
conll17-ud-test-2017-05-09 ... CoNLL 2017 test data
conll18-ud-test-2018-05-06 ... CoNLL 2018 test data
conll18-ud-test-2018-05-06-for-conll17 ... CoNLL 2018 test data with metadata
and filenames modified so that it is digestible by the 2017 systems.
Rights:
Licence Universal Dependencies v2.2 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.2 , and PUB
Creator:
Zeman, Daniel , Potthast, Martin , Straka, Milan , Popel, Martin , Dozat, Timothy , Qi, Peng , Manning, Christopher , Shi, Tianze , Wu, Felix G. , Chen, Xilun , Cheng, Yao , Björkelund, Anders , Falenska, Agnieszka , Yu, Xiang , Kuhn, Jonas , Che, Wanxiang , Guo, Jiang , Wang, Yuxuan , Zheng, Bo , Zhao, Huaipeng , Liu, Yang , Teng, Dechuan , Liu, Ting , Lim, Kyungtae , Poibeau, Thierry , Sato, Motoki , Manabe, Hitoshi , Noji, Hiroshi , Matsumoto, Yuji , Kırnap, Ömer , Önder, Berkay Furkan , Yuret, Deniz , Straková, Jana , Vania, Clara , Zhang, Xingxing , Lopez, Adam , Heinecke, Johannes , Asadullah, Munshi , Kanerva, Jenna , Luotolahti, Juhani , Ginter, Filip , Kuan, Yu , Sofroniev, Pavel , Schill, Erik , Hinrichs, Erhard , Nguyen, Dat Quoc , Dras, Mark , Johnson, Mark , Qian, Xian , Vilares, David , Gómez-Rodríguez, Carlos , Aufrant, Lauriane , Wisniewski, Guillaume , Yvon, François , Dumitrescu, Stefan Daniel , Boroş, Tiberiu , Tufiş, Dan , Das, Ayan , Zaffar, Affan , Sarkar, Sudeshna , Wang, Hao , Zhao, Hai , Zhang, Zhisong , Hornby, Ryan , Taylor, Clark , Park, Jungyeul , de Lhoneux, Miryam , Shao, Yan , Basirat, Ali , Kiperwasser, Eliyahu , Stymne, Sara , Goldberg, Yoav , Nivre, Joakim , Akkuş, Burak Kerim , Azizoglu, Heval , Cakici, Ruket , Moor, Christophe , Merlo, Paola , Henderson, James , Wang, Haozhou , Ji, Tao , Wu, Yuanbin , Lan, Man , de la Clergerie, Eric , Sagot, Benoît , Seddah, Djamé , More, Amir , Tsarfaty, Reut , Kanayama, Hiroshi , Muraoka, Masayasu , Yoshikawa, Katsumasa , Garcia, Marcos , and Gamallo, Pablo
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
dependency parser and parsebank
Language:
Arabic , Bulgarian , Russia Buriat , Czech , Catalan , Church Slavic , Danish , German , Modern Greek (1453-) , English , Spanish , Estonian , Basque , Persian , Finnish , French , Irish , Galician , Gothic , Ancient Greek (to 1453) , Hebrew , Hindi , Croatian , Upper Sorbian , Hungarian , Indonesian , Italian , Japanese , Kazakh , Northern Kurdish , Korean , Latin , Latvian , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Northern Sami , Swedish , Turkish , Uighur , Ukrainian , Urdu , Vietnamese , and Chinese
Description:
This package contains the system outputs from the CoNLL 2017 Shared Task in Multilingual Parsing from Raw Text to Universal Dependencies.
Rights:
Licence Universal Dependencies v2.0 , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-UD-2.0 , and PUB