Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Majliš, Martin
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
multilingual corpora
Language:
Afrikaans , Tosk Albanian , Amharic , Arabic , Aragonese , Egyptian Arabic , Asturian , Azerbaijani , Belarusian , Bengali , Bosnian , Bishnupriya , Breton , Buginese , Bulgarian , Catalan , Cebuano , Czech , Chuvash , Corsican , Welsh , Danish , German , Dimli (individual language) , Modern Greek (1453-) , English , Esperanto , Estonian , Basque , Faroese , Persian , Finnish , French , Western Frisian , Gan Chinese , Scottish Gaelic , Irish , Galician , Gilaki , Gujarati , Haitian , Serbo-Croatian , Hebrew , Fiji Hindi , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Ido , Interlingua (International Auxiliary Language Association) , Indonesian , Icelandic , Italian , Javanese , Japanese , Kannada , Georgian , Kazakh , Korean , Kurdish , Latin , Latvian , Limburgan , Lithuanian , Lombard , Luxembourgish , Malayalam , Marathi , Macedonian , Malagasy , Mongolian , Maori , Malay (macrolanguage) , Burmese , Neapolitan , Low German , Nepali (macrolanguage) , Newari , Dutch , Norwegian Nynorsk , Norwegian , Occitan (post 1500) , Ossetian , Pampanga , Piemontese , Polish , Portuguese , Quechua , Romanian , Russian , Yakut , Sicilian , Scots , Slovak , Slovenian , Spanish , Albanian , Serbian , Sundanese , Swahili (macrolanguage) , Swedish , Tamil , Tatar , Telugu , Tajik , Tagalog , Thai , Turkish , Ukrainian , Urdu , Uzbek , Venetian , Vietnamese , Volapük , Waray (Philippines) , Walloon , Yiddish , Yoruba , and Chinese
Description:
A set of corpora for 120 languages automatically collected from wikipedia and the web.
Collected using the W2C toolset: http://hdl.handle.net/11858/00-097C-0000-0022-60D6-1
Rights:
Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) , http://creativecommons.org/licenses/by-sa/3.0/ , and PUB
Creator:
Galuščáková, Petra and Bojar, Ondřej
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
WMT , test data , and Slovak
Language:
Slovak , Czech , and English
Description:
Testing set from WMT 2011 [1] competition, manually translated from Czech and English into Slovak. Test set contains 3003 sentences in Czech, Slovak and English. Test set is described in [2].
References:
[1] http://www.statmt.org/wmt11/evaluation-task.html
[2] Petra Galuščáková and Ondřej Bojar. Improving SMT by Using Parallel Data of a Closely Related Language. In Human Language Technologies - The Baltic Perspective - Proceedings of the Fifth International Conference Baltic HLT 2012, volume 247 of Frontiers in AI and Applications, pages 58-65, Amsterdam, Netherlands, October 2012. IOS Press. and The work on this project was supported by the grant EuroMatrixPlus (FP7-ICT-
2007-3-231720 of the EU and 7E09003 of the Czech Republic)
Rights:
Attribution-NonCommercial-ShareAlike 3.0 Unported (CC BY-NC-SA 3.0) , http://creativecommons.org/licenses/by-nc-sa/3.0/ , and PUB
Type:
text and sborníky konferenční
Subject:
Archeologie , doba bronzová , archeologie, výzkumy , archeologie, nálezy , české (československé) sborníky a kolektivní monografie , and české země ve starší době bronzové
Language:
Czech , English , German , Polish , and Slovak
Description:
Sympozium konané 15. až 17. října 2003 v Opavě
Rights:
unknown
Type:
text and sborníky konferenční
Subject:
Archeologie , doba bronzová starší , archeologie, výzkumy , archeologie, nálezy , české (československé) sborníky a kolektivní monografie , and české země ve starší době bronzové
Language:
Czech , English , German , Polish , and Slovak
Description:
Sympozium konané 15. až 17. října 2003 v Opavě
Rights:
unknown
Type:
text and publikace obrazové
Subject:
Dějiny zemí střední Evropy , dějiny slovenské , přehledná zpracování (tematicky) , and přehledná zpracování slovenských dějin (chronologicky)
Language:
Slovak and English
Description:
Se souběžným anglickým textem a názvem
Rights:
unknown
Type:
text , sborníky , and přednášky
Subject:
Sociologie kultury. Kulturní život , Češi zahraniční , Slováci zahraniční , zahraniční periodika a sborníky , and Velká Británie
Language:
Czech , English , and Slovak
Rights:
unknown
Type:
text , sborníky , and přednášky
Subject:
Sociologie kultury. Kulturní život , Češi zahraniční , Slováci zahraniční , zahraniční periodika a sborníky , and Velká Británie
Language:
Czech , English , and Slovak
Rights:
unknown
Creator:
Zudová-Lešková, Zlatica,
Type:
text and monografie kolektivní
Subject:
Vnitropolitický vývoj, politický život , Heydrich, Reinhard, , atentáty politické , represe nacistické , okupace nacistická , politika okupační , válka druhá světová (1939-1945) , české (československé) sborníky a kolektivní monografie , Československo 1938-1945 , and perzekuce, politická emigrace
Language:
Czech , English , and Slovak
Rights:
unknown
Creator:
Zudová-Lešková, Zlatica,
Type:
text and monografie kolektivní
Subject:
Vnitropolitický vývoj, politický život , Heydrich, Reinhard, , atentáty politické , represe nacistické , okupace nacistická , politika okupační , válka druhá světová (1939-1945) , české (československé) sborníky a kolektivní monografie , Československo 1938-1945 , and perzekuce, politická emigrace
Language:
Czech , English , and Slovak
Rights:
unknown
Type:
text , statický obraz , dvojrozměrný pohyblivý obraz , and monografie kolektivní
Subject:
Pozemní komunikace. Železniční stavitelství , doprava železniční , architektura železniční , památky technické , tratě železniční , nádraží , české (československé) sborníky a kolektivní monografie , české země 1792-1918 , Československo 1918-1992 , and doprava, komunikace, pošta, inženýrské sítě
Language:
Czech , English , and Slovak
Description:
Poznámky and Railway Heritage - A great Past and userful Future.
Rights:
unknown