Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Prutsch, Ursula
Subject:
emigrace , vztahy brazilsko-evropské , Češi brazilští , světové dějiny 1789-1918 , Brazílie , Habsburská monarchie , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Fričová, Yvonna,
Subject:
Frič, Alberto Vojtěch, , Boggiani, Guido, , cestovatelé , cesty výzkumné , cestopisy, cestovatelé , české země 1848-1918 , Československo 1918-1992 , and dějiny věd o neslovanských oblastech
Language:
Portuguese
Rights:
unknown
Creator:
Pelant, Matyáš
Type:
text and studie
Subject:
Světové dějiny , vztahy česko-brazilské , vztahy mezinárodní , diplomacie , vztahy hospodářské , Československo 1918-1992 , zahraniční politika, mezinárodní vztahy , hospodářské dějiny , Brazílie , and světové dějiny od r. 1918 do současnosti
Language:
Portuguese
Rights:
unknown
Creator:
Válová, Karolina,
Type:
text and monografie kolektivní
Subject:
Česká literatura (o ní) , Listopad, František, , spisovatelé , básníci , literatura česká , život literární , české (československé) sborníky a kolektivní monografie , Československo 1918-1992 , české země od r. 1993 do současnosti , and literatura, spisovatelé
Language:
Czech and Portuguese
Rights:
unknown
Creator:
Polišenský, Josef,
Subject:
Stepling, Josef, , lázně , vztahy česko-portugalské , vztahy kulturní , české země 1620-1740 , and lékařství, lázně, nemocnice, špitály
Language:
Portuguese
Rights:
unknown
Creator:
Klíma, Jan,
Type:
studie
Subject:
Dějiny Afriky , kolonie portugalské , kolonialismus , dekolonizace , Guinea-Bissau , světové dějiny od r. 1945 do současnosti , and politické dějiny, politici
Language:
Portuguese
Rights:
unknown
Creator:
Novotný, Jiří,
Type:
text and studie
Subject:
Světová ekonomika a mezinárodní finance , výstavy zahraniční , veletrhy , výstavnictví , vztahy obchodní , vztahy československo-jihoamerické , vztahy hospodářské , obchod , zahraniční výstavy , and Československo 1918-1938
Language:
Portuguese
Rights:
unknown
Creator:
Baďura, Bohumil,
Subject:
Lorenc, František Vladimír, , emigrace česká , světové dějiny 1789-1918 , světové dějiny od r. 1918 do současnosti , Brazílie , migrace, vystěhovalectví, kolonizace , české země 1848-1918 , and Československo 1918-1938
Language:
Portuguese
Rights:
unknown
Creator:
Merlotti Herédia, Vania Beatriz
Subject:
emigrace , vystěhovalectví , propaganda , Italové , Brazílie , světové dějiny 1789-1918 , Itálie , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Tamontini, Marcos Justo
Subject:
vztahy brazilsko-německé , emigrace německá , Němci brazilští , světové dějiny 1789-1918 , Brazílie , Německo , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Binková, Simona,
Subject:
výstavy zahraniční , amerikanistika , and zahraniční výstavy
Language:
Portuguese
Rights:
unknown
Creator:
Herédia, Vania Beatriz Merlotti
Subject:
emigrace italská , města brazilská , vztahy brazilsko-italské , dějiny hospodářské , světové dějiny 1789-1918 , Brazílie , Itálie , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Type:
text and dokumenty
Subject:
Politické strany a hnutí , setkání mládeže , mládež portugalská , projevy politické , Portugalsko , světové dějiny od r. 1945 do současnosti , and politické dějiny, politici
Language:
Portuguese
Rights:
unknown
Creator:
Binková, Simona,
Subject:
cestopisy , cestování , pohled na druhé , kosmologie , cestovatelé , cestopisy, cestovatelé , české země 1526-1620 , and literatura, spisovatelé
Language:
Portuguese
Rights:
unknown
Creator:
Cunhal, Álvaro,
Type:
text and monografie
Subject:
Dějiny států a území na Pyrenejském poloostrově , Cunhal, Álvaro, , politici portugalští , dějiny politické , Portugalsko , politické dějiny, politici , and světové dějiny od r. 1918 do současnosti
Language:
Portuguese
Rights:
unknown
Creator:
Cunhal, Álvaro,
Type:
text and spisy
Subject:
Politické strany a hnutí , Dějiny států a území na Pyrenejském poloostrově , revoluce , dějiny politické , Portugalsko , vnitřní politika , and světové dějiny od r. 1945 do současnosti
Language:
Portuguese
Rights:
unknown
Creator:
Kaller-Dietrich, Martina
Subject:
emigrace rakouská , vztahy argentinsko-evropské , světové dějiny 1789-1918 , světové dějiny od r. 1918 do současnosti , Habsburská monarchie , Jugoslávie , Maďarsko , Rakousko , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Štěpánek, Pavel,
Type:
text and monografie
Subject:
Dějiny civilizace. Kulturní dějiny , vztahy česko-brazilské , vztahy kulturní , vztahy brazilsko-české , zahraniční politika, mezinárodní vztahy , přehledná zpracování světových dějin (chronologicky) , Brazílie , and přehledná zpracování dějin českých zemí (chronologicky)
Language:
Portuguese
Rights:
unknown
Creator:
Madeira, Lina Alves,
Type:
text and biografie
Subject:
Dějiny států a území na Pyrenejském poloostrově , Simões, Alberto da Veiga, , diplomaté portugalští , vyslanci , politici portugalští , Portugalsko , politické dějiny, politici , světové dějiny od r. 1918 do současnosti , and světové dějiny 1789-1918
Language:
Portuguese
Rights:
unknown
Creator:
Fričová, Yvonna,
Type:
text and studie
Subject:
Dějiny civilizace. Kulturní dějiny , Frič, Alberto Vojtěch, , vztahy česko-jihoamerické , cestovatelé , botanici , etnografové , české země 1848-1918 , Československo 1918-1945 , světové dějiny 1789-1918 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Portuguese
Rights:
unknown
Type:
corpus
Language:
Arabic , Danish , Dutch , English , German , Modern Greek (1453-) , Italian , Japanese , Korean , Portuguese , Russian , Spanish , and Turkish
Description:
Large set of subtitles available for download in multiple languages. Can be used as parallel corpus.
Rights:
Not specified
Creator:
Savary, Agata , Ramisch, Carlos , Cordeiro, Silvio Ricardo , Sangati, Federico , Vincze, Veronika , QasemiZadeh, Behrang , Candito, Marie , Cap, Fabienne , Giouli, Voula , Stoyanova, Ivelina , Doucet, Antoine , Adalı, Kübra , Barbu Mititelu, Verginica , Bejček, Eduard , El Maarouf, Ismail , Eryiğit, Gülşen , Galea, Luke , Ha-Cohen Kerner, Yaakov , Liebeskind, Chaya , Monti, Johanna , Parra Escartín, Carla , Kovalevskaitė, Jolanta , Krek, Simon , van der Plas, Lonneke , Aceta, Cristina , Aduriz, Itziar , Antoine, Jean-Yves , Attard, Greta , Azzopardi, Kirsty , Boizou, Loic , Bonnici, Janice , Boz, Mert , Bumbulienė, Ieva , Busuttil, Jael , Caruso, Valeria , Cherchi, Manuela , Constant, Matthieu , Czerepowicka, Monika , De Santis, Anna , Dimitrova, Tsvetana , Dinç, Tutkum , Elyovich, Hevi , Fabri, Ray , Farrugia, Alison , Findlay, Jamie , Fotopoulou, Aggeliki , Foufi, Vassiliki , Galea, Sara Anne , Gantar, Polona , Gatt, Albert , Gatt, Anabelle , Herrero, Carlos , Iñurrieta, Uxoa , Jagfeld, Glorianna , Hnátková, Milena , Ionescu, Mihaela , Klyueva, Natalia , Koeva, Svetla , Kovács, Viktória , Kuzman, Taja , Leseva, Svetlozara , Louisou, Sevi , Lynn, Teresa , Malka, Ruth , Martínez Alonso, Héctor , McCrae, John , de Medeiros Caseli, Helena , Miral, Ayşenur , Muscat, Amanda , Nivre, Joakim , Oakes, Michael , Onofrei, Mihaela , Parmentier, Yannick , Pasquer, Caroline , Pia di Buono, Maria , Priego Sanchez, Belem , Raffone, Annalisa , Ramisch, Renata , Rimkutė, Erika , Rizea, Monica-Mihaela , Simkó, Katalin , Spagnol, Michael , Stefanova, Valentina , Stymne, Sara , Sulubacak, Umut , Tabone, Nicole , Tanti, Marc , Todorova, Maria , Urešová, Zdenka , Villavicencio, Aline , and Zilio, Leonardo
Publisher:
PARSEME
Type:
text and corpus
Subject:
Multiword expressions , verbal multiword expressions , idioms , light-verb constructions , verb-particle constructions , and inherently reflexive verbs
Language:
Bulgarian , Czech , German , Modern Greek (1453-) , Spanish , Persian , French , Hebrew , Hungarian , Italian , Lithuanian , Maltese , Polish , Portuguese , Romanian , Slovenian , Swedish , and Turkish
Description:
The PARSEME shared task aims at identifying verbal MWEs in running texts. Verbal MWEs include idioms (let the cat out of the bag), light verb constructions (make a decision), verb-particle constructions (give up), and inherently reflexive verbs (se suicider 'to suicide' in French). VMWEs were annotated according to the universal guidelines in 18 languages. The corpora are provided in the parsemetsv format, inspired by the CONLL-U format.
For most languages, paired files in the CONLL-U format - not necessarily using UD tagsets - containing parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe).
This item contains training and test data, tools and the universal guidelines file.
Rights:
PARSEME Shared Task Data (v. 1.0) Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.0 , and PUB
Creator:
Ramisch, Carlos , Cordeiro, Silvio Ricardo , Savary, Agata , Vincze, Veronika , Barbu Mititelu, Verginica , Bhatia, Archna , Buljan, Maja , Candito, Marie , Gantar, Polona , Giouli, Voula , Güngör, Tunga , Hawwari, Abdelati , Iñurrieta, Uxoa , Kovalevskaitė, Jolanta , Krek, Simon , Lichte, Timm , Liebeskind, Chaya , Monti, Johanna , Parra Escartín, Carla , QasemiZadeh, Behrang , Ramisch, Renata , Schneider, Nathan , Stoyanova, Ivelina , Vaidya, Ashwini , Walsh, Abigail , Aceta, Cristina , Aduriz, Itziar , Antoine, Jean-Yves , Arhar Holdt, Špela , Berk, Gözde , Bielinskienė, Agnė , Blagus, Goranka , Boizou, Loic , Bonial, Claire , Caruso, Valeria , Čibej, Jaka , Constant, Matthieu , Cook, Paul , Diab, Mona , Dimitrova, Tsvetana , Ehren, Rafael , Elbadrashiny, Mohamed , Elyovich, Hevi , Erden, Berna , Estarrona, Ainara , Fotopoulou, Aggeliki , Foufi, Vassiliki , Geeraert, Kristina , van Gompel, Maarten , Gonzalez, Itziar , Gurrutxaga, Antton , Ha-Cohen Kerner, Yaakov , Ibrahim, Rehab , Ionescu, Mihaela , Jain, Kanishka , Jazbec, Ivo-Pavao , Kavčič, Teja , Klyueva, Natalia , Kocijan, Kristina , Kovács, Viktória , Kuzman, Taja , Leseva, Svetlozara , Ljubešić, Nikola , Malka, Ruth , Markantonatou, Stella , Martínez Alonso, Héctor , Matas, Ivana , McCrae, John , de Medeiros Caseli, Helena , Onofrei, Mihaela , Palka-Binkiewicz, Emilia , Papadelli, Stella , Parmentier, Yannick , Pascucci, Antonio , Pasquer, Caroline , Pia di Buono, Maria , Puri, Vandana , Raffone, Annalisa , Ratori, Shraddha , Riccio, Anna , Sangati, Federico , Shukla, Vishakha , Simkó, Katalin , Šnajder, Jan , Somers, Clarissa , Srivastava, Shubham , Stefanova, Valentina , Taslimipoor, Shiva , Theoxari, Natasa , Todorova, Maria , Urizar, Ruben , Villavicencio, Aline , and Zilio, Leonardo
Publisher:
PARSEME
Type:
text and corpus
Subject:
Multiword expressions , verbal multiword expressions , light-verb constructions , verb-particle constructions , inherently reflexive verbs , verbal idioms , and multi-verb constructions
Language:
Bulgarian , German , Modern Greek (1453-) , Spanish , Persian , French , Hebrew , Hungarian , Italian , Lithuanian , Polish , Portuguese , Romanian , Slovenian , Turkish , Hindi , Basque , English , and Croatian
Description:
This multilingual resource contains corpora in which verbal MWEs have been manually annotated. VMWEs include idioms (let the cat out of the bag), light-verb constructions (make a decision), verb-particle constructions (give up), inherently reflexive verbs (help oneself), and multi-verb constructions (make do). VMWEs were annotated according to the universal guidelines in 19 languages. The corpora are provided in the cupt format, inspired by the CONLL-U format. The corpora were used in the 1.1 edition of the PARSEME Shared Task (2018).
For most languages, morphological and syntactic information – not necessarily using UD tagsets – including parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe).
This item contains training, development and test data, as well as the evaluation tools used in the PARSEME Shared Task 1.1 (2018).
The annotation guidelines are available online: http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1
Rights:
PARSEME Shared Task Data (v. 1.1) Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.1 , and PUB
Creator:
Ramisch, Carlos , Guillaume, Bruno , Savary, Agata , Waszczuk, Jakub , Candito, Marie , Vaidya, Ashwini , Barbu Mititelu, Verginica , Bhatia, Archna , Iñurrieta, Uxoa , Giouli, Voula , Güngör, Tunga , Jiang, Menghan , Lichte, Timm , Liebeskind, Chaya , Monti, Johanna , Ramisch, Renata , Stymme, Sara , Walsh, Abigail , Xu, Hongzhi , Palka-Binkiewicz, Emilia , Ehren, Rafael , Stymne, Sara , Constant, Matthieu , Pasquer, Caroline , Parmentier, Yannick , Antoine, Jean-Yves , Carlino, Carola , Caruso, Valeria , Di Buono, Maria Pia , Pascucci, Antonio , Raffone, Annalisa , Riccio, Anna , Sangati, Federico , Speranza, Giulia , Cordeiro, Silvio Ricardo , de Medeiros Caseli, Helena , Miranda, Isaac , Rademaker, Alexandre , Vale, Oto , Villavicencio, Aline , Wick Pedro, Gabriela , Wilkens, Rodrigo , Zilio, Leonardo , Rizea, Monica-Mihaela , Ionescu, Mihaela , Onofrei, Mihaela , Chen, Jia , Ge, Xiaomin , Hu, Fangyuan , Hu, Sha , Li, Minli , Liu, Siyuan , Qin, Zhenzhen , Sun, Ruilong , Wang, Chenweng , Xiao, Huangyang , Yan, Peiyi , Yih, Tsy , Yu, Ke , Yu, Songping , Zeng, Si , Zhang, Yongchen , Zhao, Yun , Foufi, Vassiliki , Fotopoulou, Aggeliki , Markantonatou, Stella , Papadelli, Stella , Louizou, Sevasti , Aduriz, Itziar , Estarrona, Ainara , Gonzalez, Itziar , Gurrutxaga, Antton , Uria, Larraitz , Urizar, Ruben , Foster, Jennifer , Lynn, Teresa , Elyovitch, Hevi , Ha-Cohen Kerner, Yaakov , Malka, Ruth , Jain, Kanishka , Puri, Vandana , Ratori, Shraddha , Shukla, Vishakha , Srivastava, Shubham , Berk, Gozde , Erden, Berna , and Yirmibeşoğlu, Zeynep
Publisher:
PARSEME
Type:
text and corpus
Subject:
multiword expressions , verbal multiword expressions , light verb construction , verb-particle constructions , inherently reflexive verbs , verbal idioms , and multi-verb constructions
Language:
German , Modern Greek (1453-) , Basque , French , Irish , Hebrew , Hindi , Italian , Polish , Portuguese , Romanian , Swedish , Turkish , and Chinese
Description:
This multilingual resource contains corpora in which verbal MWEs have been manually annotated, gathered at the occasion of the 1.2 edition of the PARSEME Shared Task on semi-supervised Identification of Verbal MWEs (2020).
VMWEs include idioms (let the cat out of the bag), light-verb constructions (make a decision), verb-particle constructions (give up), inherently reflexive verbs (help oneself), and multi-verb constructions (make do).
For the 1.2 shared task edition, the data covers 14 languages, for which VMWEs were annotated according to the universal guidelines. The corpora are provided in the cupt format, inspired by the CONLL-U format.
Morphological and syntactic information – not necessarily using UD tagsets – including parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe).
This item contains training, development and test data, as well as the evaluation tools used in the PARSEME Shared Task 1.2 (2020). The annotation guidelines are available online: http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.2
Rights:
PARSEME Shared Task Data (v. 1.2) Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.2 , and PUB
Creator:
Binková, Simona,
Subject:
vztahy evropsko-latinskoamerické , migrace , misionáři , řád, jezuité , bibliografie tematické , světové dějiny 1492-1648 , světové dějiny 1648-1789 , církevní řády a kongregace, náboženská bratrstva, kláštery , and bibliografie oborové a tematické, rejstříky časopisů
Language:
Portuguese
Description:
[Bibliografie s. 72-73].
Rights:
unknown
Creator:
Cunhal, Álvaro,
Type:
text and projevy
Subject:
Dějiny států a území na Balkánském poloostrově , Cunhal, Álvaro, , politici portugalští , strany politické , strany politické komunistické , Portugalsko , světové dějiny od r. 1918 do současnosti , and politické dějiny, politici
Language:
Portuguese
Rights:
unknown
Type:
text and dokumenty
Subject:
Politické strany a hnutí , hnutí dělnické , stávky , Portugalsko , dělnictvo, chudina , and světové dějiny 1939-1945
Language:
Portuguese
Rights:
unknown
Creator:
Cristóvão, Fernando
Subject:
cestovatelé , cestování , přístavy , světové dějiny středověku (do r. 1492) , světové dějiny novověku (1492-1918) , and doprava, komunikace, pošta, inženýrské sítě
Language:
Portuguese
Rights:
unknown
Creator:
Marques, António Henrique R. de Oliveira
Publisher:
Centro de Estudos Históricos,
Subject:
atlasy , geografie historická , kolonie , objevy zámořské , dějiny států , politické dějiny, politici , přehledná zpracování světových dějin (chronologicky) , Portugalsko , and historická geografie, kartografie a topografie
Language:
Portuguese
Rights:
unknown
Creator:
Marques, António Henrique R. de Oliveira,
Type:
text and atlasy
Subject:
Dějiny států a území na Pyrenejském poloostrově , Historická geografie , geografie historická , kolonie , objevy zámořské , dějiny států , Portugalsko , politické dějiny, politici , přehledná zpracování světových dějin (chronologicky) , and historická geografie, kartografie a topografie
Language:
Portuguese
Rights:
unknown
Publisher:
Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:
lexicalConceptualResource
Language:
Catalan , English , French , Galician , Italian , Portuguese , and Spanish
Description:
A vocabulary resulting from the cooperation of the groups of REALITER network that collects the basic terminology mostly used in texts about Genomics. It contains equivalents in English, Peninsular and Latinamerican Spanish, French, Italian, Galician, Portuguese and Catalan.
Rights:
Not specified
Creator:
Martínek, Jiří,
Type:
text and studie
Subject:
Vědy o Zemi. Geologické vědy , Katzer, Bedřich, , geologové , cestovatelé , vztahy česko-brazilské , české země 1848-1918 , vědy o neživé přírodě, přírodní prostředí, astronomie , Brazílie , Bosna a Hercegovina , světové dějiny 1789-1918 , and Habsburská monarchie
Language:
Portuguese
Rights:
unknown
Creator:
Witker, Ivan
Subject:
emigrace německá , Němci čeští , Němci chilští , světové dějiny od r. 1918 do současnosti , Chile , migrace, vystěhovalectví, kolonizace , and české země 1848-1918
Language:
Portuguese
Rights:
unknown
Creator:
Oliveira, Sergio P.
Subject:
imigrace , vztahy brazilsko-portugalské , hranice státní , světové dějiny od r. 1918 do současnosti , Brazílie , Portugalsko , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) , http://creativecommons.org/licenses/by-nc/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) , http://creativecommons.org/licenses/by-nc-nd/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) , http://creativecommons.org/licenses/by-nc-sa/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Malayalam , Macedonian , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NoDerivatives 4.0 International (CC BY-ND 4.0) , http://creativecommons.org/licenses/by-nc/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution 4.0 International (CC BY 4.0) , http://creativecommons.org/licenses/by/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Dutch , Norwegian , Polish , Portuguese , Russian , Slovenian , Somali , Spanish , Swahili (macrolanguage) , Swedish , Tagalog , Thai , Turkish , Ukrainian , Undetermined , and Vietnamese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Public Domain Mark (PD) , http://creativecommons.org/publicdomain/mark/1.0/ , and PUB
Creator:
Piccolo, Helga Iracema Landgraf,
Subject:
emigrace německá , vztahy německo-brazilské , korespondence , světové dějiny 1789-1918 , Brazílie , Německo , and migrace, vystěhovalectví, kolonizace
Language:
Portuguese
Rights:
unknown
Creator:
Křížová, Markéta,
Type:
text and studie
Subject:
Dějiny civilizace. Kulturní dějiny , Loukotka, Čestmír, , lingvisté , antropologové , Československo 1918-1992 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Portuguese
Rights:
unknown
Creator:
Dietrich, Wolfgang
Subject:
emigrace česká , emigrace hospodářská , Češi guatemalští , Guatemala , migrace, vystěhovalectví, kolonizace , české země 1848-1918 , and Československo 1918-1992
Language:
Portuguese
Rights:
unknown
Creator:
Jorge, Joaquim Pires,
Type:
text and autobiografie
Subject:
Politika , Jorge, Joaquim Pires, , komunisté portugalští , antifašismus , Portugalsko , světové dějiny od r. 1918 do současnosti , odboj, odpor, antifašismus, antikomunismus , and politické dějiny, politici
Language:
Portuguese
Rights:
unknown
Creator:
Covello, Sergio Carlos
Type:
text and studie
Subject:
Organizace výuky a vzdělávání , Komenský, Jan Amos, , myšlení pedagogické , české země 1526-1792 , and školství, pedagogika, učitelé, péče o mládež
Language:
Portuguese
Rights:
unknown
Creator:
Kulesza, Wojciech Andrzej
Type:
text and studie
Subject:
Organizace výuky a vzdělávání , Komenský, Jan Amos, , myšlení pedagogické , pedagogika , české země 1526-1792 , and školství, pedagogika, učitelé, péče o mládež
Language:
Portuguese
Rights:
unknown
Creator:
Araújo Sampaio, Bohumila de
Type:
text and studie
Subject:
Organizace výuky a vzdělávání , Komenský, Jan Amos, , teologové , filozofové , vztahy česko-brazilské , světové dějiny 1789-1918 , světové dějiny od r. 1918 do současnosti , Brazílie , české země 1526-1792 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Portuguese
Rights:
unknown
Creator:
Pánek, Jaroslav,
Type:
text and studie
Subject:
Výchova a vzdělávání , Komenský, Jan Amos, , myšlení pedagogické , filozofové čeští , české země 1526-1792 , and školství, pedagogika, učitelé, péče o mládež
Language:
Portuguese
Rights:
unknown
Type:
corpus
Language:
English and Portuguese
Description:
bi-directional parallel corpus based on an open-ended collection of Portuguese-English and English-Portuguese source-texts and translations. Searchable via the IMS Corpus Query Processor and the DISPARA interface
Rights:
Not specified