Coverage: Spain / Harvested from: LINDAT/CLARIAH-CZ repository - LINDAT/CLARIAH-CZ Catalog Search Results

1. Apertium Old Catalan morphological analyzer

Publisher:: Universidad de Alicante
Type:: toolService
Subject:: morphological analyzer
Language:: Catalan
Description:: A RESTful morphological analyzer for Old Catalan.
Rights:: Not specified

2. Aquén - Toponimia galega

Publisher:: TALG Research Group (University of Vigo)
Type:: lexicalConceptualResource
Language:: Galician
Description:: Galician Toponymy Database, 40,000 entries
Rights:: Not specified

3. Banco de neologismos 2004-2007

Publisher:: Instituto Cervantes and Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Subject:: neologisms database
Language:: Catalan
Description:: Repository of neologisms (15.375 entries)
Rights:: Not specified

4. Basic vocabulary on the Human Genome

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Language:: Catalan, English, French, Galician, Italian, Portuguese, and Spanish
Description:: A vocabulary resulting from the cooperation of the groups of REALITER network that collects the basic terminology mostly used in texts about Genomics. It contains equivalents in English, Peninsular and Latinamerican Spanish, French, Italian, Galician, Portuguese and Catalan.
Rights:: Not specified

5. BUSCANEO

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan and Spanish
Description:: Tool for neologism extraction.
Rights:: Not specified

6. Bústia Neològica Escolar

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan and Spanish
Description:: Terminology management
Rights:: Not specified

7. Bwananet

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan, English, and Spanish
Description:: Tool for querying the Technical Corpus of the Institut Universitari de Lingüística Aplicada.
Rights:: Not specified

8. calcular_p_cue_class

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Statistical analysis service: It calculates P(cue|class): probability of seeing a linguistic cue given a lexical class. This probability is computed given the occurrences of cues in a corpus (codified in the signatures file) and the information of belonging or not belonging of these words to different classes (codified in indicators file). The probability is computed for each studied cue in the signatures file and for each class in the indicators file.
Rights:: Not specified

9. Catalan Annotated Corpora CQP

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: This RESTful service allows to define a sub-corpus from different annotated corpora. The service includes a POS tag harmonisation process where original tags are converted to EAGLES/Parole format. The eventual sub-corpus is indexed using the IMS CWB tool. The user receives an ID which can be used by the CQP service to exploit the sub-corpus.
Rights:: Not specified

10. Catalan Digital Press

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: This RESTful service accesses part of the Hemeroteca Digital de l’Arxiu Municipal de Girona (digital press archive from the Girona city council), specifically Catalan press from 2003. The service uses the SRU protocol.
Rights:: Not specified

11. catdoc

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Format conversion service: Word .doc to .txt converter
Rights:: Not specified

12. Cercador NEOROM

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan and Spanish
Description:: Search engine for the neologisms database of the NEOROM network. The network collects neologisms used in the press written in Romance languages from 2005 onwards.
Rights:: Not specified

13. Cercador OBNEO

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Search engine of the BOBNEO data bank, a database of neologisms present in the mass media in Spanish and Catalan, written and oral, from 1992.
Rights:: Not specified

14. COLDIC

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Tool for dictionary management
Rights:: Not specified

15. Corpus bilingüe d’alternança de llengües (codeswitching)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Subject:: speech corpus
Language:: Catalan, English, and Spanish
Description:: 8 interactive recordings of group dynamics. Bilingual speakers (L1 -> English; L1 -> Catalan/Spanish).
Rights:: Not specified

16. Corpus bilingüe de La Canonja en temps aparent (TA)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Subject:: oral corpus and bilingual
Language:: Catalan and Spanish
Description:: Bilingual oral corpus containing 30 life histories/sociolinguistic interviews (17 in Catalan and 13 in Spanish) carried out in La Canonja (Tarragona).
Rights:: Not specified

17. Corpus CLUVI

Publisher:: TALG Research Group (University of Vigo)
Type:: corpus
Language:: Basque, Catalan, English, French, Galician, German, Portuguese, and Spanish
Description:: Parallel corpus, 22 million words
Rights:: Not specified

18. Corpus d’entrevistes sociolingüístiques a castellanoparlants i catalanoparlants en temps aparent (TA)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Subject:: oral corpus
Language:: Catalan and Spanish
Description:: Oral corpus containing 15 sociolinguistic interviews in Spanish and Catalan, carried out by means of Labovian techniques.
Rights:: Not specified

19. Corpus d’extractes de gravacions d’Internet en temps aparent (TA) i temps real (TR) amb finalitats forenses

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Subject:: corpus
Language:: English
Rights:: Not specified

20. Corpus de narratives d’angloparlants immigrats a Espanya en temps aparent (TA)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Language:: English
Description:: Oral corpus containing 166 narratives in English elicited by means of Labovian techniques. Participants from the UK (England, Wales, Scotland), Ireland, USA, Australia and South Africa.
Rights:: Not specified

21. Corpus de parlants catalanoparlants de La Canonja en temps real (TR)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Subject:: oral corpus
Language:: Catalan
Description:: Oral corpus containing 10 sociolinguistic interviews carried out in La Canonja (Tarragona).
Rights:: Not specified

22. Corpus PAAU 92

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Language:: Spanish
Description:: The electronic version of the book “Corpus PAAU 1992: Descriptive Studies, Texts and Vocabulary” includes the texts that have been object of analysis in this project as well as the vocabulary lists that make up the Corpus 92.
Rights:: Not specified

23. Corpus Tècnic de l'IULA

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: corpus
Language:: Catalan, English, and Spanish
Description:: domain specific corpus (Law, Economy, Computing, Medicine and Environment as well as a contrastive corpus from the press); EN 3.3 M tokens, SP 33 M tokens, CAT 19 M tokens; EAGLEs pos tagset
Rights:: Not specified

24. Corpus Técnico do Galego

Publisher:: TALG Research Group (University of Vigo)
Type:: corpus
Language:: Galician
Description:: Domain-specific corpus (Law, Computing, Medicine, Economy, Sociology and Environment), 22 million words
Rights:: Not specified

25. Corpus Textual lnformatitzat de la Llengua Catalana (CTILC)

Publisher:: Institut d'Estudis Catalans
Type:: corpus
Subject:: corpus
Language:: Catalan
Description:: Corpus containing Catalan texts written in the time span from 1832 to 1988 and totalling over 52 million words.
Rights:: Not specified

26. Corpus Thomisticum

Publisher:: University of Navarra, Spain
Type:: corpus
Language:: Latin
Description:: "A scholarly edition of Aquinas's Opera omnia, with a lexical database, a dictionary, two collection of historical sources, and an extensive bibliography."
Rights:: Not specified

27. Corpus Work Bench CWB (CQP)

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: This SOAP service implements the IMS Open Corpus Workbench (CWB), a collection of open-source tools for managing and querying large text corpora (ranging from 10 million to 2 billion words) with linguistic annotations. Its central component is the flexible and efficient query processor CQP. The service makes it possible to index a new corpus and query it.
Rights:: Not specified

28. Dependency Grammars

Publisher:: Universitat de Barcelona
Type:: languageDescription
Subject:: dependency grammar
Language:: Catalan, English, and Spanish
Description:: Dependency grammars
Rights:: Not specified

29. Diccionario de neologismos on line

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Subject:: neologisms database
Language:: Spanish
Description:: Lexicographic resource containing 3.530 neologisms documented in press written in Spanish between 1989 and 2007.
Rights:: Not specified

30. Dicionario CLUVI inglés-galego

Publisher:: TALG Research Group (University of Vigo)
Type:: lexicalConceptualResource
Language:: English and Galician
Description:: Corpus-based English-Galician bilingual dictionary
Rights:: Not specified

31. Digitized Press

Publisher:: Girona City Council
Type:: corpus
Subject:: digitized corpus
Language:: Catalan and Spanish
Description:: Collection of different digitized mastheads in Catalan and Spanish, covering a time span from 1808 to 2008. The collection, which is kept in the Girona City Council Archive, totals 1.599.733 digitized pages.
Rights:: Not specified

38. freeling

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Web service consisting of the Freeling open source language analysis tool suite.
Rights:: Not specified

39. FreeLing

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: toolService
Language:: Catalan, English, Galician, Italian, Portuguese, and Welsh
Description:: Open source language analysis tool suite: tokenizer, stemmer/lemmatizer, named entity recognizer, chunker/segmenter, morphosyntactic tagger, syntactic tagger, corpus processer, morphological tagger, semantic tagger, analyzer, Word Sense Disambiguator.
Rights:: Not specified

40. freeling_dependency

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Freeling-based dependency parser.
Rights:: Not specified

41. freeling_morpho

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Freeling-based morphological analyzer.
Rights:: Not specified

42. freeling_parsed

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Freeling-based shallow parser.
Rights:: Not specified

43. freeling_tagging

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Freeling-based part-of-speech tagger.
Rights:: Not specified

44. freeling_tokenizer

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Freeling-based text tokenizer.
Rights:: Not specified

45. Guanchet corpus

Type:: languageDescription
Description:: Guanchet is the language spoken by the canary natives in the millenia previous to the Hispanic conquest.
Rights:: Not specified

46. html2text

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Format conversion service: .html to .txt converter
Rights:: Not specified

47. InTime

Creator:: Gómez, José M., Navarro, Sergio, and Martínez-Barco, Patricio
Publisher:: Universidad de Alicante
Type:: toolService
Description:: Integration Platform of Natural Language Processing resources
Rights:: Not specified

48. iula_lexicon_lookup

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Lexicon lookup (given a word form, the webservice returns the information in the lexicon).
Rights:: Not specified

49. iula_preprocess

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Text preprocess (this preprocess service requires that the input text be in plain text format (file .txt) and UTF-8). Basically, it carries out: (i) text segmentation into minor structural units (titles, paragraphs, sentences, etc.); (ii) detection of entities not found in dictionaries (numbers, abbreviations, URLs, emails, proper nouns, etc.); and (iii) the keeping of sequences of two or more words in a single block (dates, phrases, proper nouns, etc.).
Rights:: Not specified

50. iula_tagger

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: POS tagger. (The input file must be in plain text format (file.txt) and UTF-8 encoded. The disambiguation process is done by a TreeTagger instance trained by the IULA.)
Rights:: Not specified

51. iula_tokenizer

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Text tokenizer (the text tokenizer requires that the input text be in plain text format (file.txt) and UTF-8 encoded).
Rights:: Not specified

52. Jaguar

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: A tool for statistical corpus exploitation. It offers concordances, counts ngrams, extracts collocations and gives association, distribution and similarity measures.
Rights:: Not specified

53. JIRS

Publisher:: Grid and High Performance Computing Group, ITACA, Universidad Politécnica de Valencia and Universidad de Alicante
Type:: toolService
Language:: Arabic, English, French, Italian, Oromo, and Urdu
Description:: JIRS is a Passage Retrieval system specially suited for Question Answering. It could be adapted to others languages very easily. ask (Written Language): Information Retrieval Applications Question/Answering Environment: OS-independent Access: GPLv3
Rights:: Not specified

54. jointparser

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: toolService
Description:: Parser that jointly annotates syntax and semantics. It performs syntactic parsing, shallow semantic parsing and predicate identification.
Rights:: Not specified

55. kwic

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Word concordancer.
Rights:: Not specified

56. LC-STAR Dialogues

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: corpus
Subject:: oral corpus and bilingual
Language:: Catalan and Spanish
Description:: Bilingual oral corpus (55 hours recording). 77 Spanish speakers; 59 Catalan speakers; Environment: Local telephone. Annotation: orthographic.
Rights:: Not specified

57. LCsum (Document Summarizer)

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: toolService
Language:: Catalan, English, and Spanish
Description:: Document summarizer.
Rights:: Not specified

58. Mercedes

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan
Description:: A tool for contrasting terminological vocabularies and textual corpora. It allows controlling the presence and location of reference vocabularies in textual corpora.
Rights:: Not specified

59. Multilingual Central Repository

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: lexicalConceptualResource
Subject:: lexical database
Language:: Basque, Catalan, English, Galician, and Spanish
Description:: Multilingual lexical database that follows the model proposed by the EuroWordNet project. The MCR integrates into the same EuroWordNet framework wordnets from five different languages (together with four English WordNet versions). It also integrates WordNet Domains and new versions of the Base Concepts and Top Concept Ontology. Overall, it contains 1,642,389 semantic relations between synsets, most of them acquired by automatic means. Information contained: semantics, synonyms, antonyms, definition, equivalents, example of use, morphology.
Rights:: Not specified

60. Neologismos económicos en las lenguas románicas a través de la prensa

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Subject:: terminology database
Language:: Catalan, French, Galician, Italian, Portuguese, Romanian, and Spanish
Description:: Multilingual terminological resource containing 3.875 entries from the Economics, Finance and Banking domains.
Rights:: Not specified

61. Neoteca

Publisher:: TALG Research Group (University of Vigo)
Type:: lexicalConceptualResource
Language:: Galician
Description:: Galician neology databank
Rights:: Not specified

62. ngrams

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Ted Pedersen's Ngram Statistics Package (used to identify word Ngrams that appear in large corpora using standard tests of association such as Fisher's exact test, the log likelihood ratio, Pearson's chi-squared test, the Dice Coefficient, etc.).
Rights:: Not specified

63. PALIC

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan, French, Portuguese, and Spanish
Description:: A package of tools for the processing of the Corpus Tècnic in Catalan and Spanish. It includes a preprocessor, a PoSTagger and a linguistic disambiguator.
Rights:: Not specified

64. panacea_conversor

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Format conversion service: Panacea conversion tool
Rights:: Not specified

65. pdftotext

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Format conversion service: .pdf to .txt converter
Rights:: Not specified

66. POPPINS

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Document classifier
Rights:: Not specified

67. SOLC

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Language:: Catalan
Description:: An orthologic server for Catalan. A query system for the orthologic dictionary which allows making searches using dialectal and pragmatic variables.
Rights:: Not specified

68. Spanish Resource Grammar

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: languageDescription
Language:: Spanish
Description:: HPSG like grammar for the analysis of Spanish, implemented in LKB
Rights:: Not specified

69. Spanish WordNet 3.0

Publisher:: Universitat de Barcelona
Type:: lexicalConceptualResource
Language:: Spanish
Description:: 63.000 synsets, plain text
Rights:: Not specified

70. SVMTool

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: toolService
Language:: Catalan, English, and Spanish
Description:: Generator of sequential taggers based on Support Vector Machines.
Rights:: Not specified

71. Termoteca

Publisher:: TALG Research Group (University of Vigo)
Type:: lexicalConceptualResource
Language:: English, French, Galician, and Spanish
Description:: Galician terminology databank, 6,000 terms
Rights:: Not specified

72. tfidf

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: It calculates the Term Frequency and the Inverse Document Frequency of a word in a given corpus (a statistical measure used to evaluate how important a word is to a document in a collection or corpus).
Rights:: Not specified

73. Tools for Catalan and Spanish corpus processing

Publisher:: IULA, Universitat Pompeu Fabra
Type:: toolService
Subject:: corpus processing
Description:: A package of tools for Catalan and Spanish corpus processing. It includes a text handling module and a probabilistic POS tagger. It also allows consulting POS tagger dictionary data.
Rights:: Not specified

74. Vocabulario multilingüe de economía

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Subject:: terminology database
Language:: Basque, Catalan, English, Galician, and Spanish
Description:: Multilingual terminological resource containing 20.941 terms from the Economics, Finance and Banking domains.
Rights:: Not specified

75. Vocabulary on work-risks prevention

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: lexicalConceptualResource
Language:: Catalan and Spanish
Description:: An electronic version of a vocabulary that resulted from the collaboration with the Labour Department. Its nomenclature includes more than 1,000 terms; besides, it contains six thematic annexes and a Catalan-Spanish index.
Rights:: Not specified

76. vocabulary_analysis

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Statistical analysis service: It calculates different lexicometric measures and displays them graphically (tokens, types, hapaxes & type/token ratio).
Rights:: Not specified

77. VOLEM

Publisher:: Universitat de Lleida
Type:: lexicalConceptualResource
Language:: Spanish
Description:: Multilingual Verbal Lexicon: Catalan , spanish (connexion with French and Basc of other groups)
Rights:: Not specified

78. Wikicorpus

Publisher:: Centro de Tecnologías y Aplicaciones del Lenguaje y del Habla (TALP)
Type:: corpus
Subject:: trilingual corpus
Language:: Catalan, English, and Spanish
Description:: Trilingual corpus (Catalan, Spanish, English) that contains large portions of the Wikipedia (based on a 2006 dump) and has been automatically enriched with linguistic information. In its present version, it contains over 750 million words.
Rights:: Not specified

79. xsltproc

Publisher:: Institut Universitari de Lingüística Aplicada, Universitat Pompeu Fabra
Type:: toolService
Description:: Format conversion service: a command line tool for applying XSLT stylesheets to XML documents
Rights:: Not specified

Search

Search Constraints

Search Results

Limit your search

Contributor

Show values starting with

Coverage

Creator

Format

Language

Show values starting with

Publisher

Show values starting with

Rights

Subject

Show values starting with

Type

Date

Original context has metadata only

Harvested from