Lingüística con corpus (I)

  1. Villayandre Llamazares, Milka
Revista:
Estudios humanísticos. Filología

ISSN: 0213-1392 2444-023X

Año de publicación: 2008

Número: 30

Páginas: 329-349

Tipo: Artículo

Otras publicaciones en: Estudios humanísticos. Filología

Resumen

En este artículo hacernos una introducción a la metodología lingüística basada en el trabajo con corpus. En primer lugar, repasamos los diferentes conceptos de corpus en relación con las corrientes teóricas más influyentes en los últimos siglos. En un segundo punto fijamos las características que definen el concepto actual de corpus y que lo diferencian de otras recopilaciones de textos. Por último, revisamos los principales tipos de corpus y comentamos algunos de los ejemplos más representativos, con especial énfasis en los corpus para el español y otras lenguas peninsulares.

Referencias bibliográficas

  • Aarts, J. y Meijs, W. (eds.) (1984): Corpus Linguistics, Amsterdam, Rodopi.
  • Abaitua, J. (2002): “Tratamiento de corpora bilingües”, en M. A. Martí y J. Llisterri (eds.): Tratamiento del lenguaje natural: tecnología de la lengua oral y escrita, Soria/Barcelona, Fundación Duques de Soria/Edicions de la Universitat de Barcelona, 61-90.
  • Abercrombie, D. (1965): Studies in Phonetics and Linguistics, London, Oxford
  • Aijmer, K. y Altenberg, B. (eds.) (1991): English Corpus Linguistics. Studies in Honour of Jan Svartvik, Londres, Longman.
  • Arquivo Sonoro de Galicia (ASG) http://www.consellodacultura.org/arquivos/asg/anosafala.php
  • Base de Datos Sintácticos del Español Actual (BDS) http://www.bds.usc.es/
  • Biber, D., Conrad, S. y Reppen, R. (1998): Corpus Linguistics. Investigating Language Structure and Use, Cambridge, C.U.P.
  • Brown University Corpus of American English (Brown Corpus) http://icame.uib.no/brown/bcm.html (manual)
  • CESS-ECE, Corpus etiquetado sintáctico-semánticamente (español, catalán, euskera) http://clic.ub.edu/cessece/
  • CLUVI, Corpus Lingüístico da Universidade de Vigo http://sli.uvigo.es/CLUVI/info.html
  • Corpus de conversación coloquial del grupo Val.Es.Co. http://www.uv.es/~valesco/valesco_5.html
  • Corpus de Referencia del Español Contemporáneo (CREA) http://www.rae.es/
  • Corpus de Referencia do Galego Actual (CORGA) http://corpus.cirp.es/corga/
  • Corpus Diacrónico del Español (CORDE) http://www.rae.es/
  • Corpus estadístico del euskera del siglo XX ttp://www.uzei.com/antbuspre.asp?nombre=1901&cod=1901&sesion=1
  • Corpus textual especializado plurilingüe, IULA http://www.iula.upf.edu/corpus/corpuses.htm
  • Corpus Textual Informatitzat de la Llengua Catalana (CTILC) http://www.iec.cat/gc/ViewPage.action?siteNodeId=690&languageId=1&contentId=3284; http://ctilc.iec.cat/
  • Francis, W. N. (1992): “Language Corpora B.C.”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York, Mouton de Gruyter, 17-32.
  • Labov, W. (1969): “The logic of non-standard English”, Georgetown Monographs on Language and Linguistics, 22.
  • Lancaster-Oslo/Bergen Corpus (LOB) http://khnt.hit.uib.no/icame/manuals/lob/INDEX.HTM (manual) http://khnt.hit.uib.no/icame/manuals/lobman/INDEX.HTM (anotaciones)
  • Lavid, J. (2005): Lenguaje y nuevas tecnologías. Nuevas perspectivas, métodos y herramientas para el lingüista del siglo XXI, Madrid, Cátedra.
  • Leech, G. (1992): “Corpora and theories of linguistic performance”, en J. Svartvik (ed.): Directions in Linguistics: Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin, Mouton de Gruyter, 105-122.
  • Martí Antonín, M. A. y Castellón Masalles, I. (2000): Lingüística computacional, Barcelona, Universitat de Barcelona.
  • McEnery, T. (2003): “Corpus Linguistics”, en R. Mitkov (ed.), The Oxford Handbook of Computational Linguistics, Oxford, Oxford University Press, 448-463.
  • McEnery, T. y Wilson, A. (1996): Corpus Linguistics, Edinburgh, Edinburgh University Press. Suplemento web disponible en la dirección: http://www.ling.lancs.ac.uk/monkey/ihe/linguistics/contents.htm
  • McEnery, T., Xiao, R. y Tono, Y. (2006): Corpus-Based Language Studies. An advanced resource book, London/New York, Routledge.
  • Moreno Sandoval, A. (2001): Gramáticas de unificación y rasgos, Madrid, A. Machado Libros.
  • Moure, T. y Llisterri, J. (1996): “Lenguaje y nuevas tecnologías: el campo de la lingüística computacional”, en M. Fernández Pérez (coord.): Avances en Lingüística aplicada, Universidade de Santiago de Compostela, Servicio de Publicacións e Intercambio Científico, 147-227. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/llisterri_moure_96.html Real Academia Española (2001): Diccionario de la lengua española, Madrid, Espasa.
  • PRESEEA, Proyecto para el Estudio Sociolingüístico del Español de España y de América http://www.linguas.net/Default.aspx?alias=www.linguas.net/portalpreseea
  • Proyecto COBUILD http://www.collins.co.uk/books.aspx?group=140
  • Santalla del Río, M.ª P. (2005): “La elaboración de corpus lingüísticos”, en M. Cal, P. Núñez e I. M. Palacios (eds.): Nuevas tecnologías en Lingüística, Traducción y Enseñanza de lenguas, Universidade de Santiago de Compostela, Servizo de Publicacións e Intercambio Científico, 45-63.
  • Sinclair, J. (1994): EAGLES, Document EAG-CWG-IR-2.
  • Sinclair, J. (1996): EAGLES Preliminary recommendations on Corpus Typology. Documento electrónico en: http://www.ilc.cnr.it/EAGLES96/corpustyp/corpustyp.html
  • SpeechDat http://www.speechdat.org/
  • Survey of English Usage (SEU) http://www.ucl.ac.uk/english-usage
  • Survey of Spoken English (SSE) y London-Lund Corpus of Spoken English (LLC) http://icame.uib.no/london-lund/ http://khnt.hit.uib.no/icame/manuals/LONDLUND/INDEX.HTM
  • Svartvik, J. (1992): “Corpus linguistics comes of age”, en J. Svartvik (ed.): Directions in Corpus Linguistics. Proceedings of Nobel Symposium 82 (Stockholm, 4-8 August 1991), Berlin/New York:, Mouton de Gruyter, 7-13.
  • Tesouro Medieval Informatizado da Lingua Galega (TMILG) http://ilg.usc.es/tmilg/
  • The Bank of English http://www.titania.bham.ac.uk/
  • The British National Corpus (BNC) http://www.natcorp.ox.ac.uk/
  • The International Corpus of English (ICE) http://www.ucl.ac.uk/english-usage/projects/ice.htm http://www.ucl.ac.uk/english-usage/ice/index.htm
  • Torruella, J. y Llisterri, J. (1999): “Diseño de corpus textuales y orales”, en J. M. Blecua, G. Clavería, C. Sánchez y J. Torruella (eds.): Filología e informática. Nuevas tecnologías en los estudios filológicos, Barcelona, Milenio/Universidad Autónoma de Barcelona, Dpto. de Filología Española, 45-77. Disponible electrónicamente en: http://liceu.uab.es/~joaquim/publicacions/Torruella_Llisterri_99.pdf University Press.