Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Majliš, Martin
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
multilingual corpora
Language:
Afrikaans , Tosk Albanian , Amharic , Arabic , Aragonese , Egyptian Arabic , Asturian , Azerbaijani , Belarusian , Bengali , Bosnian , Bishnupriya , Breton , Buginese , Bulgarian , Catalan , Cebuano , Czech , Chuvash , Corsican , Welsh , Danish , German , Dimli (individual language) , Modern Greek (1453-) , English , Esperanto , Estonian , Basque , Faroese , Persian , Finnish , French , Western Frisian , Gan Chinese , Scottish Gaelic , Irish , Galician , Gilaki , Gujarati , Haitian , Serbo-Croatian , Hebrew , Fiji Hindi , Hindi , Croatian , Upper Sorbian , Hungarian , Armenian , Ido , Interlingua (International Auxiliary Language Association) , Indonesian , Icelandic , Italian , Javanese , Japanese , Kannada , Georgian , Kazakh , Korean , Kurdish , Latin , Latvian , Limburgan , Lithuanian , Lombard , Luxembourgish , Malayalam , Marathi , Macedonian , Malagasy , Mongolian , Maori , Malay (macrolanguage) , Burmese , Neapolitan , Low German , Nepali (macrolanguage) , Newari , Dutch , Norwegian Nynorsk , Norwegian , Occitan (post 1500) , Ossetian , Pampanga , Piemontese , Polish , Portuguese , Quechua , Romanian , Russian , Yakut , Sicilian , Scots , Slovak , Slovenian , Spanish , Albanian , Serbian , Sundanese , Swahili (macrolanguage) , Swedish , Tamil , Tatar , Telugu , Tajik , Tagalog , Thai , Turkish , Ukrainian , Urdu , Uzbek , Venetian , Vietnamese , Volapük , Waray (Philippines) , Walloon , Yiddish , Yoruba , and Chinese
Description:
A set of corpora for 120 languages automatically collected from wikipedia and the web.
Collected using the W2C toolset: http://hdl.handle.net/11858/00-097C-0000-0022-60D6-1
Rights:
Attribution-ShareAlike 3.0 Unported (CC BY-SA 3.0) , http://creativecommons.org/licenses/by-sa/3.0/ , and PUB
Creator:
Urlanis, Boris Cezarevič,
Type:
text and monografie
Subject:
Demografie. Populace , demografie historická , války , dějiny obyvatelstva , dějiny osídlení, regionální dějiny , přehledná zpracování světových dějin (chronologicky) , and historická demografie
Language:
English and Russian
Rights:
unknown
Creator:
Hoang, Duc Tam and Bojar, Ondřej
Publisher:
Charles University, Faculty of Mathematics and Physics, Institute of Formal and Applied Linguistics (UFAL)
Type:
text and corpus
Subject:
test data , parallel corpus , and Vietnamese
Language:
Vietnamese , Czech , English , German , French , Spanish , and Russian
Description:
We provide the Vietnamese version of the multi-lingual test set from WMT 2013 [1] competition. The Vietnamese version was manually translated from English. For completeness, this record contains the 3000 sentences in all the WMT 2013 original languages (Czech, English, French, German, Russian and Spanish), extended with our Vietnamese version. Test set is used in [2] to evaluate translation between Czech, English and Vietnamese.
References
1. http://www.statmt.org/wmt13/evaluation-task.html
2. Duc Tam Hoang and Ondřej Bojar, The Prague Bulletin of Mathematical Linguistics. Volume 104, Issue 1, Pages 75--86, ISSN 1804-0462. 9/2015
Rights:
Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) , http://creativecommons.org/licenses/by-nc-sa/4.0/ , and PUB
Publisher:
University of Leipzig
Type:
corpus
Language:
Afrikaans , Albanian , Bulgarian , Catalan , Chinese , Croatian , Czech , Danish , Dutch , English , Esperanto , Estonian , Finnish , French , German , Hungarian , Icelandic , Indonesian , Italian , Japanese , Korean , Latin , Latvian , Lithuanian , Malay (macrolanguage) , Norwegian , Occitan (post 1500) , Romanian , Russian , Slovak , Slovenian , Spanish , Sundanese , Swedish , Tagalog , Turkish , Vietnamese , and Welsh
Description:
Collected from newspaper texts, webcrawling, etc.: words (+frequency), cooccurrences (+graph), left/right neighbours, example sentences
Rights:
Not specified
Publisher:
Národní knihovna ČR,
Subject:
slavistika , slavisté , bibliografie oborové , konference vědecké , světové dějiny od r. 1945 do současnosti , bibliografie oborové a tematické, rejstříky časopisů , and dějiny slavistiky
Language:
Czech , English , and Russian
Description:
The Eleventh International Congress of Slavists. Bibliography.
Rights:
unknown
Type:
text and sborníky
Subject:
Dějiny civilizace. Kulturní dějiny , věda o antice , dějiny starověkého Řecka , dějiny starověkého Říma , české (československé) sborníky a kolektivní monografie , and antický svět
Language:
Czech , English , German , and Russian
Rights:
unknown
Publisher:
Masarykův ústav a Archiv AV ČR,
Type:
sborníky jubilejní
Subject:
Dějiny Česka a Slovenska , Biografie , Masaryk, Tomáš Garrigue, , Opat, Jaroslav, , filozofové , politici , prezidenti českoslovenští , české (československé) sborníky a kolektivní monografie , české země 1848-1918 , Československo 1918-1992 , filozofie, filozofové , and politické dějiny, politici
Language:
Czech , English , German , and Russian
Rights:
unknown
Publisher:
Masarykův ústav a Archiv AV ČR,
Type:
sborníky jubilejní
Subject:
Dějiny Česka a Slovenska , Biografie , Masaryk, Tomáš Garrigue, , Opat, Jaroslav, , filozofové , politici , prezidenti českoslovenští , české (československé) sborníky a kolektivní monografie , české země 1848-1918 , Československo 1918-1992 , filozofie, filozofové , and politické dějiny, politici
Language:
Czech , English , German , and Russian
Rights:
unknown
Creator:
Gagen, Sergej Jakovlevič
Type:
text and katalogy výstav
Subject:
Sociologie kultury. Kulturní život , emigrace ruská , emigrace polská , emigranti , intelektuálové , Československo 1918-1938 , migrace, vystěhovalectví, kolonizace , Rusko , světové dějiny 1789-1918 , and perzekuce, politická emigrace
Language:
Czech , English , and Russian
Description:
Část názvu "exilu" je tištěn kombinací latinky a cyrilice and Částečně přeloženo z francouzštiny a ukrajinštiny?
Rights:
unknown