Generadores de concordancias
aConcorde - aConcorde es una herramienta de concordancia multilingüe. Desarrollada en un principio como generador básico de concordancias para el árabe, posee interfaz tanto para el inglés como para el árabe.
ConcApp - por Chris Greaves
TextStat - TextSTAT es un programa de análisis de textos. Reconoce textos ASCII/ANSI (con diferente codificación) y archivos HTML (directamente de Internet), y produce listas de frecuencia de palabras y concordancias entre esos archivos.
Congresos
Corpus
DCPSE (The Diachronic Corpus of Present-Day Spoken English) - DCPSE se trata de un nuevo corpus analizado sintácticamente de inglés hablado, disponible en CD-ROM. Contiene 400.000 palabras del ICE-GB (recopiladas a principios de los 90) y 400.000 palabras del London-Lund Corpus (finales de los 60 - principios de los 80).
ICE (Corpus Internacional de Inglés)
Lancaster University (Corpus elaborados por)
Leipzig Corpora Collection - Recopilación de frases en la base de datos MySQL en 17 idiomas europeos principales.
Reuters - Actualmente, el NIST distribuye los corpus Reuters.
The English Norwegian Parallel Corpus
TalkBank - La base de datos TalkBank contiene transcripciones y archivos multimedia recopilados de conversaciones con adultos y niños.
The Alex Catalogue of Electronic texts - The Alex Catalogue of Electronic Texts consiste en una recopilación de aproximadamente 14.000 textos clásicos de dominio público de la literatura americana, de la literatura inglesa y de la filosofía occidental.
Translational English Corpus (TEC)
Corpus en español
Corpus en la UE
OPUS (Open Source Parallel Corpus) - OPUS es un intento por recopilar, transformar y alinear textos traducidos de la web, así como por añadir datos lingüísticos y proporcionar a la comunidad un corpus paralelo que esté disponible públicamente. OPUS se basa en productos de libre acceso y se han empleado varias herramientas para compilarlo. Así mismo, puede utilizarse con Europarl Search Engine.
The JRC-Acquis Multilingual Parallel Corpus - El Acervo Comunitario (AC) es el conjunto normativo vigente en la Unión Europea (UE) aplicable en los estados miembro de la UE. Este conjunto de textos legislativos cambia continuamente y en la actualidad comprende textos desde 1950.
Cursos de CL&CTS
A Crash Course in Corpus Linguistics
Análisis de colocaciones basados en corpus
Corpus Linguistics. A Practical Web-based Course
Corpus Linguistics (Ben Bergen)
Course in Corpus Linguistics (University of Essex)
Information about corpus building and investigation
Diccionarios
Documentos sobre corpus
ECI (European Corpus Initiative) - La Iniciativa de Corpus Europeos (ECI) se fundó para supervisar la adquisición y la preparación de un amplio corpus multilingüe (ECI/MCI) y disponerlo en formato digital para la investigación científica a un coste tan bajo como fuera posible. El corpus lleva disponible en CD-ROM desde 1994, y se distribuye a través de ELSNET.
LDC (Linguistic Data Consortium)
Revistas
Journal of Quantitative Linguistics
New Voices in Translation Studies
Otros
CETH (Center for Electronic Texts in the Humanities)
Parlamentos e información relacionada
Directorio de parlamentos de países
IPEX (Interparliamentary EU Information Exchange)
ECPRD (European Centre for Parliamentary Research and Documentation)
ECPR (European Consortium for Political Research)
The Euro-Mediterranean Parliamentary Assembly (EMPA)
COSAC (Conference of Community and European Affairs Committees of Parliaments of the European Union)
Centros de investigación
UCL Centre for English Corpus Linguistic (CECL)
Centre for corpus research. University of Birmingham
Investigadores
Software y herramientas
Enseñanza y aprendizaje de una lengua mediante corpus
XML