Skip to search
Skip to main content
Skip to first result
Search
Search Results
Creator:
Llosa, Alvar de la,
Type:
text and studie
Subject:
Dějiny Střední Ameriky a Karibské oblasti , Mezinárodní vztahy, světová politika , vztahy mezinárodní , politika zahraniční , diplomacie francouzská , Kuba , světové dějiny od r. 1945 do současnosti , and zahraniční politika, mezinárodní vztahy
Language:
Spanish
Rights:
unknown
Creator:
Bauçà i Sastre, Andreu
Type:
text and studie
Subject:
Přirozená teologie. Náboženská filozofie , eschatologie , propaganda politická , dějiny církevní , středověk pozdní , renesance , Španělsko , světové dějiny středověku (do r. 1492) , světové dějiny 1492-1648 , and církevní a náboženské dějiny
Language:
Spanish
Rights:
unknown
Creator:
Arce Padrón, Yissel
Type:
text and studie
Subject:
Dějiny Střední Ameriky a Karibské oblasti , Umění , umění , paměť historická , Kuba , světové dějiny od r. 1945 do současnosti , and dějiny umění, mecenát
Language:
Spanish
Rights:
unknown
Creator:
Bouček, Jaroslav,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , vztahy česko-brazilské , průmysl , vztahy hospodářské , válka druhá světová (1939-1945) , Brazílie , světové dějiny 1939-1945 , průmysl, manufaktury, hornictví, pivovary , and Československo 1938-1945
Language:
Spanish
Rights:
unknown
Creator:
Anderle, Ádám,
Type:
text and články
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , Opatrný, Josef, , iberoamerikanisté , historici , jubilea životní , and historici (jubilea, nekrology apod.)
Language:
Spanish
Rights:
unknown
Creator:
Kašpar, Oldřich,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , řád, jezuité , misie , misionáři , vztahy česko-americké , české země 1526-1792 , církevní řády a kongregace, náboženská bratrstva, kláštery , světové dějiny 1492-1648 , and světové dějiny 1648-1789
Language:
Spanish
Rights:
unknown
Creator:
Novotný, Jiří,
Type:
text and studie
Subject:
Zahraniční obchod. Mezinárodní obchod , vztahy ekonomické , banky , bankovnictví , vztahy hospodářské , politika obchodní , obchod zahraniční , vztahy československo-mexické , Československo 1918-1945 , Československo 1945-1948 , hospodářské dějiny , Mexiko , and světové dějiny 1918-1945
Language:
Spanish
Rights:
unknown
Creator:
Binková, Simona,
Type:
text and zprávy o činnosti
Subject:
Filologie , instituce vědecké , iberoamerikanisté , iberoamerikanistika , Univerzita Karlova , české a československé vědecké instituce a společnosti, vysoké školy , české země od r. 1993 do současnosti , and dějiny věd o neslovanských oblastech
Language:
Spanish
Rights:
unknown
Creator:
Binková, Simona,
Type:
zprávy o činnosti
Subject:
Filologie , Univerzita Karlova , instituce vědecké , iberoamerikanistika , iberoamerikanisté , české a československé vědecké instituce a společnosti, vysoké školy , české země od r. 1993 do současnosti , and dějiny věd o neslovanských oblastech
Language:
Spanish
Rights:
unknown
Creator:
Brenišínová, Monika
Type:
text and články
Subject:
Filologie , instituce vědecké , Univerzita Karlova , iberoamerikanistika , iberoamerikanisté , and české a československé vědecké instituce a společnosti, vysoké školy
Language:
Spanish
Rights:
unknown
Creator:
Kašpar, Oldřich,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , vztahy francouzsko-brazilské , vztahy česko-brazilské , Brazílie , světové dějiny 1492-1648 , přehledná zpracování (tematicky) , Francie , and české země 1526-1620
Language:
Spanish
Rights:
unknown
Creator:
Romero, Martín Félix
Type:
text and studie
Subject:
Mezinárodní vztahy, světová politika , vztahy německo-argentinské , nacismus , Argentina , světové dějiny 1918-1945 , zahraniční politika, mezinárodní vztahy , and Německo
Language:
Spanish
Rights:
unknown
Creator:
Opatrný, Josef,
Type:
text and nekrology
Subject:
Historická věda. Pomocné vědy historické. Archivnictví , Anderle, Ádám, , iberoamerikanisté , hispanisté , Maďaři , historici , Maďarsko , světové dějiny od r. 1945 do současnosti , dějiny věd o neslovanských oblastech , and historici (jubilea, nekrology apod.)
Language:
Spanish
Rights:
unknown
Creator:
Morales, Etienne
Type:
text and studie
Subject:
Mezinárodní vztahy, světová politika , doprava letecká , vztahy mezinárodní , sovětizace , Kuba , SSSR , světové dějiny od r. 1945 do současnosti , and zahraniční politika, mezinárodní vztahy
Language:
Spanish
Rights:
unknown
Type:
text and vzpomínky
Subject:
Dějiny Střední Ameriky a Karibské oblasti , Sandino, Augusto César, , revolucionáři nikaragujští , vzpomínky , vojáci , Nikaragua , armáda, vojenské složky, vojáci , and světové dějiny 1918-1945
Language:
Spanish
Rights:
unknown
Creator:
Kouřím, Zdeněk,
Type:
text and nekrology
Subject:
Biografie , Filozofie , Guy, Alain, , filozofové francouzští , filozofie latinskoamerická , světové dějiny od r. 1918 do současnosti , and filozofie, filozofové
Language:
Spanish
Rights:
unknown
Creator:
Palau Baquero, Mercedes
Type:
text and studie
Subject:
Geografie jako věda. Výzkum. Cestování , Malaspina, Alessandro, , cestování , cestovatelé , mořeplavci , and cestopisy, cestovatelé
Language:
Spanish
Rights:
unknown
Creator:
Diard, Dominique
Type:
text and studie
Subject:
Španělská literatura, španělsky psaná (o ní) , Dějiny Střední Ameriky a Karibské oblasti , Carpentier, Alejo, , literatura španělská , spisovatelé kubánští , Kuba , světové dějiny od r. 1918 do současnosti , and přehledná zpracování (tematicky)
Language:
Spanish
Rights:
unknown
Creator:
Sáez, Adrián J.
Type:
studie
Subject:
Křesťanství. Křesťanská církev všeobecně. Eklesiologie , Divadlo. Divadelní představení , Calderón de la Barca, Pedro, , divadlo jezuitské , drama , Španělsko , světové dějiny novověku (1492-1918) , světové dějiny 1648-1789 , divadlo, film, fotografie , and církevní řády a kongregace, náboženská bratrstva, kláštery
Language:
Spanish
Description:
Something More about Calderón and the Jesuit Theatre: about "Los Entremeses".
Rights:
unknown
Creator:
Bortlová, Hana,
Type:
text and studie
Subject:
Mezinárodní migrace, exil, kolonizace , Češi argentinští , migrace , orální historie , Argentina , světové dějiny 1789-1918 , světové dějiny od r. 1918 do současnosti , migrace, vystěhovalectví, kolonizace , české země 1848-1918 , and Československo 1918-1992
Language:
Spanish
Rights:
unknown
Type:
corpus
Language:
Arabic , Danish , Dutch , English , German , Modern Greek (1453-) , Italian , Japanese , Korean , Portuguese , Russian , Spanish , and Turkish
Description:
Large set of subtitles available for download in multiple languages. Can be used as parallel corpus.
Rights:
Not specified
Creator:
Staněk, Karel,
Type:
studie
Subject:
Dějiny států a území na Pyrenejském poloostrově , expanze územní , kolonie portugalské , kolonialismus , kovy drahé , Portugalsko , světové dějiny 1492-1648 , světové dějiny středověku (do r. 1492) , and zahraniční politika, mezinárodní vztahy
Language:
Spanish
Rights:
unknown
Creator:
Opatrný, Josef,
Type:
text and studie
Subject:
Geografie jako věda. Výzkum. Cestování , Klindera, Ferdinand, , Vaníček, Vojtěch C., , Frič, Alberto Vojtěch, , Čech-Vyšata, František, , Forejt-Alan, Vladislav, , Klecanda, Vojtěch Vladimír, , Elstner, František Alexander, , Erben, Josef Ladislav, , Kodýtková, Anna , cestovatelé , cestování , vystěhovalci , světové dějiny 1918-1945 , migrace, vystěhovalectví, kolonizace , Československo 1918-1938 , and cestopisy, cestovatelé
Language:
Spanish
Rights:
unknown
Creator:
Cortés Zavala, María Teresa
Type:
text and studie
Subject:
Dějiny Střední Ameriky a Karibské oblasti , Ledrú, André Pierre, , Vizcarrondo, Julio L. de, , expedice vědecké , botanici francouzští , vzpomínky , cestopisy , popisy zemí , kolonie španělské , politika koloniální , otrokářství , hnutí abolicionistické , Portoriko , světové dějiny 1648-1789 , zahraniční politika, mezinárodní vztahy , světové dějiny 1789-1918 , and cestopisy, cestovatelé
Language:
Spanish
Rights:
unknown
Creator:
Savary, Agata , Ramisch, Carlos , Cordeiro, Silvio Ricardo , Sangati, Federico , Vincze, Veronika , QasemiZadeh, Behrang , Candito, Marie , Cap, Fabienne , Giouli, Voula , Stoyanova, Ivelina , Doucet, Antoine , Adalı, Kübra , Barbu Mititelu, Verginica , Bejček, Eduard , El Maarouf, Ismail , Eryiğit, Gülşen , Galea, Luke , Ha-Cohen Kerner, Yaakov , Liebeskind, Chaya , Monti, Johanna , Parra Escartín, Carla , Kovalevskaitė, Jolanta , Krek, Simon , van der Plas, Lonneke , Aceta, Cristina , Aduriz, Itziar , Antoine, Jean-Yves , Attard, Greta , Azzopardi, Kirsty , Boizou, Loic , Bonnici, Janice , Boz, Mert , Bumbulienė, Ieva , Busuttil, Jael , Caruso, Valeria , Cherchi, Manuela , Constant, Matthieu , Czerepowicka, Monika , De Santis, Anna , Dimitrova, Tsvetana , Dinç, Tutkum , Elyovich, Hevi , Fabri, Ray , Farrugia, Alison , Findlay, Jamie , Fotopoulou, Aggeliki , Foufi, Vassiliki , Galea, Sara Anne , Gantar, Polona , Gatt, Albert , Gatt, Anabelle , Herrero, Carlos , Iñurrieta, Uxoa , Jagfeld, Glorianna , Hnátková, Milena , Ionescu, Mihaela , Klyueva, Natalia , Koeva, Svetla , Kovács, Viktória , Kuzman, Taja , Leseva, Svetlozara , Louisou, Sevi , Lynn, Teresa , Malka, Ruth , Martínez Alonso, Héctor , McCrae, John , de Medeiros Caseli, Helena , Miral, Ayşenur , Muscat, Amanda , Nivre, Joakim , Oakes, Michael , Onofrei, Mihaela , Parmentier, Yannick , Pasquer, Caroline , Pia di Buono, Maria , Priego Sanchez, Belem , Raffone, Annalisa , Ramisch, Renata , Rimkutė, Erika , Rizea, Monica-Mihaela , Simkó, Katalin , Spagnol, Michael , Stefanova, Valentina , Stymne, Sara , Sulubacak, Umut , Tabone, Nicole , Tanti, Marc , Todorova, Maria , Urešová, Zdenka , Villavicencio, Aline , and Zilio, Leonardo
Publisher:
PARSEME
Type:
text and corpus
Subject:
Multiword expressions , verbal multiword expressions , idioms , light-verb constructions , verb-particle constructions , and inherently reflexive verbs
Language:
Bulgarian , Czech , German , Modern Greek (1453-) , Spanish , Persian , French , Hebrew , Hungarian , Italian , Lithuanian , Maltese , Polish , Portuguese , Romanian , Slovenian , Swedish , and Turkish
Description:
The PARSEME shared task aims at identifying verbal MWEs in running texts. Verbal MWEs include idioms (let the cat out of the bag), light verb constructions (make a decision), verb-particle constructions (give up), and inherently reflexive verbs (se suicider 'to suicide' in French). VMWEs were annotated according to the universal guidelines in 18 languages. The corpora are provided in the parsemetsv format, inspired by the CONLL-U format.
For most languages, paired files in the CONLL-U format - not necessarily using UD tagsets - containing parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe).
This item contains training and test data, tools and the universal guidelines file.
Rights:
PARSEME Shared Task Data (v. 1.0) Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.0 , and PUB
Creator:
Ramisch, Carlos , Cordeiro, Silvio Ricardo , Savary, Agata , Vincze, Veronika , Barbu Mititelu, Verginica , Bhatia, Archna , Buljan, Maja , Candito, Marie , Gantar, Polona , Giouli, Voula , Güngör, Tunga , Hawwari, Abdelati , Iñurrieta, Uxoa , Kovalevskaitė, Jolanta , Krek, Simon , Lichte, Timm , Liebeskind, Chaya , Monti, Johanna , Parra Escartín, Carla , QasemiZadeh, Behrang , Ramisch, Renata , Schneider, Nathan , Stoyanova, Ivelina , Vaidya, Ashwini , Walsh, Abigail , Aceta, Cristina , Aduriz, Itziar , Antoine, Jean-Yves , Arhar Holdt, Špela , Berk, Gözde , Bielinskienė, Agnė , Blagus, Goranka , Boizou, Loic , Bonial, Claire , Caruso, Valeria , Čibej, Jaka , Constant, Matthieu , Cook, Paul , Diab, Mona , Dimitrova, Tsvetana , Ehren, Rafael , Elbadrashiny, Mohamed , Elyovich, Hevi , Erden, Berna , Estarrona, Ainara , Fotopoulou, Aggeliki , Foufi, Vassiliki , Geeraert, Kristina , van Gompel, Maarten , Gonzalez, Itziar , Gurrutxaga, Antton , Ha-Cohen Kerner, Yaakov , Ibrahim, Rehab , Ionescu, Mihaela , Jain, Kanishka , Jazbec, Ivo-Pavao , Kavčič, Teja , Klyueva, Natalia , Kocijan, Kristina , Kovács, Viktória , Kuzman, Taja , Leseva, Svetlozara , Ljubešić, Nikola , Malka, Ruth , Markantonatou, Stella , Martínez Alonso, Héctor , Matas, Ivana , McCrae, John , de Medeiros Caseli, Helena , Onofrei, Mihaela , Palka-Binkiewicz, Emilia , Papadelli, Stella , Parmentier, Yannick , Pascucci, Antonio , Pasquer, Caroline , Pia di Buono, Maria , Puri, Vandana , Raffone, Annalisa , Ratori, Shraddha , Riccio, Anna , Sangati, Federico , Shukla, Vishakha , Simkó, Katalin , Šnajder, Jan , Somers, Clarissa , Srivastava, Shubham , Stefanova, Valentina , Taslimipoor, Shiva , Theoxari, Natasa , Todorova, Maria , Urizar, Ruben , Villavicencio, Aline , and Zilio, Leonardo
Publisher:
PARSEME
Type:
text and corpus
Subject:
Multiword expressions , verbal multiword expressions , light-verb constructions , verb-particle constructions , inherently reflexive verbs , verbal idioms , and multi-verb constructions
Language:
Bulgarian , German , Modern Greek (1453-) , Spanish , Persian , French , Hebrew , Hungarian , Italian , Lithuanian , Polish , Portuguese , Romanian , Slovenian , Turkish , Hindi , Basque , English , and Croatian
Description:
This multilingual resource contains corpora in which verbal MWEs have been manually annotated. VMWEs include idioms (let the cat out of the bag), light-verb constructions (make a decision), verb-particle constructions (give up), inherently reflexive verbs (help oneself), and multi-verb constructions (make do). VMWEs were annotated according to the universal guidelines in 19 languages. The corpora are provided in the cupt format, inspired by the CONLL-U format. The corpora were used in the 1.1 edition of the PARSEME Shared Task (2018).
For most languages, morphological and syntactic information – not necessarily using UD tagsets – including parts of speech, lemmas, morphological features and/or syntactic dependencies are also provided. Depending on the language, the information comes from treebanks (e.g., Universal Dependencies) or from automatic parsers trained on treebanks (e.g., UDPipe).
This item contains training, development and test data, as well as the evaluation tools used in the PARSEME Shared Task 1.1 (2018).
The annotation guidelines are available online: http://parsemefr.lif.univ-mrs.fr/parseme-st-guidelines/1.1
Rights:
PARSEME Shared Task Data (v. 1.1) Agreement , https://lindat.mff.cuni.cz/repository/xmlui/page/licence-mwe-1.1 , and PUB
Creator:
Klíma, Jan,
Type:
text and články
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , Neugebauer, Antonín, , socialismus , vztahy československo-argentinské , Argentina , světové dějiny 1789-1918 , and sociologie, psychologie, sociologové, psychologové
Language:
Spanish
Rights:
unknown
Creator:
Szente-Varga, Mónika,
Type:
text and studie
Subject:
Mezinárodní vztahy, světová politika , Xantus, János, , Naphegyi, Gábor, , přírodovědci , cestovatelé , obchodníci , světové dějiny 1789-1918 , and dějiny vědy, umění, kultury a techniky, kulturní vztahy
Language:
Spanish
Rights:
unknown
Creator:
Baďura, Bohumil,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , kolonie španělské , kolonialismus , správa koloniální , světové dějiny novověku (1492-1918) , zahraniční politika, mezinárodní vztahy , and Španělsko
Language:
Spanish
Rights:
unknown
Creator:
Baďura, Bohumil,
Type:
text and studie
Subject:
Zahraniční obchod. Mezinárodní obchod , vztahy česko-mexické , vztahy obchodní , obchod se sklem , české země 1740-1792 , české země 1792-1847 , obchod , Mexiko , and světové dějiny 1789-1918
Language:
Spanish
Rights:
unknown
Creator:
Manke, Albert
Type:
text and studie
Subject:
Dějiny Střední Ameriky a Karibské oblasti , revoluce kubánská , milice , společnost kubánská , Kuba , světové dějiny od r. 1945 do současnosti , and armáda, vojenské složky, vojáci
Language:
Spanish
Rights:
unknown
Creator:
Vidal Prades, Emma Dunia,
Type:
text and studie
Subject:
Zahraniční obchod. Mezinárodní obchod , obchod mezinárodní , otrokářství , obchod s lidmi , Kuba , světové dějiny 1789-1918 , and obchod
Language:
Spanish
Rights:
unknown
Publisher:
Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:
lexicalConceptualResource
Language:
Catalan , English , French , Galician , Italian , Portuguese , and Spanish
Description:
A vocabulary resulting from the cooperation of the groups of REALITER network that collects the basic terminology mostly used in texts about Genomics. It contains equivalents in English, Peninsular and Latinamerican Spanish, French, Italian, Galician, Portuguese and Catalan.
Rights:
Not specified
Creator:
Anderle, Ádám,
Type:
text and studie
Subject:
Dějiny Jižní Ameriky. Latinská Amerika , Castro, Fidel, , Guevara, Ernesto Che, , revoluce kubánská , partyzáni , revolucionáři , Kuba , světové dějiny od r. 1945 do současnosti , and politické dějiny, politici
Language:
Spanish
Rights:
unknown
Creator:
Polišenský, Josef,
Type:
text and studie
Subject:
Mezinárodní vztahy, světová politika , vztahy česko-španělské , krize politické , vztahy politické , české země 1526-1620 , zahraniční politika, mezinárodní vztahy , Španělsko , and světové dějiny 1492-1648
Language:
Spanish
Rights:
unknown
Type:
text and brožury
Subject:
Dějiny Česka a Slovenska , válka druhá světová (1939-1945) , nálety , bombardování měst , Československo 1938-1945 , vojenské operace, války, bitvy , and města, obce
Language:
Czech , English , French , Russian , and Spanish
Description:
Souběžný anglický, francouzský, ruský a španělský text
Rights:
unknown
Type:
corpus
Subject:
Germanistik
Language:
Chinese , Czech , English , French , German , Latin , and Spanish
Description:
Digital copies of historical botanic papers from the Missouri Botanical Garden Library; Bilddigitalisate von historischen botanischen Schriften; deutschsprachige Texte stellen nur einen Teilbereich dar
Rights:
Not specified
Creator:
Sappez, Delphine
Type:
text and studie
Subject:
Dějiny Střední Ameriky a Karibské oblasti , Govín y Torres, Antonio, , myšlení politické , myšlení historické , autonomismus , kolonialismus , Kuba , světové dějiny 1789-1918 , and politické dějiny, politici
Language:
Spanish
Rights:
unknown
Publisher:
Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:
toolService
Language:
Catalan and Spanish
Description:
Tool for neologism extraction.
Rights:
Not specified
Creator:
Křížová, Markéta,
Type:
text and studie
Subject:
Křesťanská sdružení, spolky a organizace. Řeholní řády , řád, jezuité , misie jezuitské , misionáři , vztahy česko-latinskoamerické , vztahy česko-mexické , historiografie česká , přehledná zpracování dějin českých zemí (chronologicky) , církevní řády a kongregace, náboženská bratrstva, kláštery , historiografie, vědecké projekty , Mexiko , and světové dějiny 1648-1789
Language:
Spanish
Rights:
unknown
Publisher:
Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:
toolService
Language:
Catalan and Spanish
Description:
Terminology management
Rights:
Not specified
Publisher:
Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:
toolService
Language:
Catalan , English , and Spanish
Description:
Tool for querying the Technical Corpus of the Institut Universitari de Lingüística Aplicada.
Rights:
Not specified
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial 4.0 International (CC BY-NC 4.0) , http://creativecommons.org/licenses/by-nc/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial-NoDerivatives 4.0 International (CC BY-NC-ND 4.0) , http://creativecommons.org/licenses/by-nc-nd/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NonCommercial-ShareAlike 4.0 International (CC BY-NC-SA 4.0) , http://creativecommons.org/licenses/by-nc-sa/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Malayalam , Macedonian , Dutch , Norwegian , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-NoDerivatives 4.0 International (CC BY-ND 4.0) , http://creativecommons.org/licenses/by-nc/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution-ShareAlike 4.0 International (CC BY-SA 4.0) , http://creativecommons.org/licenses/by-sa/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bengali , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Gujarati , Hebrew , Hindi , Croatian , Hungarian , Indonesian , Italian , Japanese , Kannada , Korean , Latvian , Lithuanian , Malayalam , Marathi , Macedonian , Nepali (macrolanguage) , Dutch , Norwegian , Panjabi , Polish , Portuguese , Romanian , Russian , Slovak , Slovenian , Somali , Spanish , Albanian , Swahili (macrolanguage) , Swedish , Tamil , Telugu , Tagalog , Thai , Turkish , Ukrainian , Undetermined , Urdu , Vietnamese , and Chinese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Creative Commons - Attribution 4.0 International (CC BY 4.0) , http://creativecommons.org/licenses/by/4.0/ , and PUB
Creator:
Gurevych, Iryna , Habernal, Ivan , and Zayed, Omnia
Publisher:
Technische Universität Darmstadt
Type:
text and corpus
Subject:
CommonCrawl , Creative Commons , Web corpus , and Amazon Web Services
Language:
Afrikaans , Arabic , Bulgarian , Czech , Danish , German , Modern Greek (1453-) , English , Estonian , Persian , Finnish , French , Croatian , Hungarian , Indonesian , Italian , Japanese , Korean , Latvian , Lithuanian , Dutch , Norwegian , Polish , Portuguese , Russian , Slovenian , Somali , Spanish , Swahili (macrolanguage) , Swedish , Tagalog , Thai , Turkish , Ukrainian , Undetermined , and Vietnamese
Description:
A large web corpus (over 10 billion tokens) licensed under CreativeCommons license family in 50+ languages that has been extracted from CommonCrawl, the largest publicly available general Web crawl to date with about 2 billion crawled URLs.
Rights:
Public Domain Mark (PD) , http://creativecommons.org/publicdomain/mark/1.0/ , and PUB
Creator:
Hidalgo De Cisneros, Ignacio,
Type:
text and paměti
Subject:
Dějiny států a území na Pyrenejském poloostrově , paměti , armáda španělská , Španělsko , armáda, vojenské složky, vojáci , and světové dějiny 1918-1945
Language:
Spanish
Rights:
unknown