Skip to search
Skip to main content
Skip to first result
Search
Search Results
Type:
text and sborníky konferenční
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , sborníky konferenční , dějiny zemí , Matice moravská , and české (československé) sborníky a kolektivní monografie
Language:
Czech , Polish , Slovak , and German
Rights:
unknown
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Mareček, David , Yu, Zhiwei , Zeman, Daniel , and Žabokrtský, Zdeněk
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
part of speech , tagging , semi-supervised , and cross-language
Language:
Belarusian , Bosnian , Bulgarian , Czech , Serbo-Croatian , Croatian , Upper Sorbian , Macedonian , Polish , Russian , Slovak , Slovenian , Serbian , Ukrainian , Latvian , Lithuanian , Afrikaans , Danish , German , English , Faroese , Western Frisian , Swiss German , Icelandic , Limburgan , Luxembourgish , Low German , Dutch , Norwegian Nynorsk , Norwegian , Scots , Swedish , Yiddish , Aragonese , Asturian , Catalan , French , Galician , Haitian , Italian , Latin , Lombard , Neapolitan , Piemontese , Portuguese , Romanian , Spanish , Venetian , Walloon , Breton , Welsh , Scottish Gaelic , Irish , Modern Greek (1453-) , Armenian , Albanian , Dimli (individual language) , Persian , Gilaki , Kurdish , Tajik , Bengali , Bishnupriya , Gujarati , Fiji Hindi , Hindi , Marathi , Nepali (macrolanguage) , Urdu , Amharic , Arabic , Egyptian Arabic , Hebrew , Estonian , Finnish , Hungarian , Basque , Georgian , Chuvash , Azerbaijani , Turkish , Uzbek , Kazakh , Tatar , Yakut , Korean , Mongolian , Telugu , Kannada , Malayalam , Tamil , Newari , Vietnamese , Indonesian , Javanese , Malagasy , Maori , Malay (macrolanguage) , Pampanga , Sundanese , Tagalog , Waray (Philippines) , Swahili (macrolanguage) , Esperanto , Ido , Interlingua (International Auxiliary Language Association) , and Volapük
Description:
Texts in 107 languages from the W2C corpus (http://hdl.handle.net/11858/00-097C-0000-0022-6133-9), first 1,000,000 tokens per language, tagged by the delexicalized tagger described in Yu et al. (2016, LREC, Portorož, Slovenia).
Changes in version 1.1:
1. Universal Dependencies tagset instead of the older and smaller Google Universal POS tagset.
2. SVM classifier trained on Universal Dependencies 1.2 instead of HamleDT 2.0.
3. Balto-Slavic languages, Germanic languages and Romance languages were tagged by classifier trained only on the respective group of languages. Other languages were tagged by a classifier trained on all available languages. The "c7" combination from version 1.0 is no longer used.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Type:
text and sborníky konferenční
Subject:
Dějiny Česka a Slovenska , Jagellonci (rod) , umění výtvarné , and české (československé) sborníky a kolektivní monografie
Language:
Czech , Polish , and Slovak
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Archeologie , doba halštatská , kultury popelnicových polí , české země v době bronzové , and české země v době halštatské
Language:
Czech , Polish , and Slovak
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Genealogie. Heraldika. Šlechta. Vlajky , kultura dvorská , život každodenní , společnost středověká , and české (československé) sborníky a kolektivní monografie
Language:
Czech , German , Polish , and Slovak
Rights:
unknown
Type:
text and sborníky
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , epigrafika , památky sepulkrální , dějiny umění , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , Slovak , and Polish
Rights:
unknown
Type:
text and sborníky
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , epigrafika , památky sepulkrální , dějiny umění , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , Slovak , and Polish
Description:
Referáty z 12. zasedání k problematice sepulkrálních památek "Justorum autem animae in manu dei sunt" v Praze 31. 10. - 1. 11. 2013 a ze 13. zasedání "O mors, quam amara est memoria tua" v Praze 30. - 31. 10. 2014
Rights:
unknown
Type:
text and sborníky jubilejní
Subject:
Filologie , Marvan, Jiří, , slavisté , baltisté , slavistika , baltistika , and české (československé) sborníky a kolektivní monografie
Language:
Czech , English , Lithuanian , Polish , and Slovak
Description:
"... obsahově vychází ze sympozia Balto-slavica na prahu století, které ... uspořádala pražská Slovanská knihovna a Ústav slavistických a východoevropských studií Filozofické fakulty Univerzity Karlovy dne 19. dubna 2006"--Úvod
Rights:
unknown
Type:
text and sborníky
Subject:
Mezinárodní migrace, exil, kolonizace , emigrace náboženská , exil , reemigrace , reemigranti , české (československé) sborníky a kolektivní monografie , české země 1526-1792 , migrace, vystěhovalectví, kolonizace , and církevní a náboženské dějiny
Language:
Czech , German , Polish , and Slovak
Description:
"Sborník textů (nejen) z mezinárodní konference spolku Exulant - Exulanti, vyhnanci a uprchlíci pořádané ve dnech 14.-16. října 2016 v Litomyšli"--Tiráž
Rights:
unknown