Procesamiento del Lenguaje Natural
Una de las ramas más importantes de la Inteligencia Artificial es
aquella orientada a facilitar la comunicación hombre-computadora por
medio del lenguaje humano, o lenguaje natural. El Procesamiento del Lenguaje
Natural (PLN) es la disciplina encargada de producir sistemas informáticos
que posibiliten dicha comunicación, por medio de la voz o del texto.
Se trata de una disciplina tan antigua como el uso de las computadoras
(años 50), de gran profundidad, y con aplicaciones tan importantes
como la traducción automática o la búsqueda de
información en Internet. Dado el tiempo disponible, es imperativo
concentrar nuestros esfuerzos en un ámbito necesariamente limitado:
los sistemas de PLN que utilizan técnicas de carácter
estadístico aplicados al análisis del texto.
El objetivo principal de esta asignatura es dotar a los alumnos de
conocimientos sobre las técnicas que se emplean para el desarrollo
de este tipo de sistemas, concentrándonos en los aspectos que conciernen
a los métodos estadísticos de tratamiento del texto,
y destacando las siguientes tareas de clasificación: la
recuperación de documentos, la categorización
automática de documentos, la resolución de la
ambigüedad léxica y el etiquetado sintáctico.
Otros temas de interés para los alumnos de esta asignatura son los
siguientes:
Recursos
-
Documentación
-
Introducción al Procesamiento del Lenguaje Natural
(transparencias,
práctica 1).
-
Léxico y morfología
(transparencias,
problemas,
práctica 3).
-
Técnicas de análisis sintáctico
(transparencias,
ejemplos,
problemas).
-
Representación del significado y semántica
(transparencias,
ejemplos,
problemas).
-
Interpretación contextual y pragmática (transparencias).
-
Aplicaciones 1: Traducción automática (transparencias).
-
Aplicaciones 2: Extracción de información
(transparencias).
-
Bibliografía
-
Bibliografía general
-
(GA) C. GAZDAR, C. MELLISH, Natural Language Processing in
Prolog, Addison Wesley, 1989 (P98 .G39 Biblioteca UEM, versión
en POP-11 / Disponible en
http://www.informatics.susx.ac.uk/research/nlp/gazdar/nlp-in-prolog/).
-
(MA) C. MANNING, H. SCHÜTZE, Foundations of Statistical Natural
Language Processing, The MIT Press, 1999 (P98.5 .S83 M36 Biblioteca UEM).
-
Bibliografía complementaria
-
J. ALLEN, Natural Language Understanding, Benjamin/Cummings, 1987
(QA76.7 .A45 Biblioteca UEM).
-
E. CHARNIAK, Statistical Language Learning, MIT Press, 1993 (P98.5
.S83 C43 Biblioteca UEM).
-
P. JACKSON, I. MOULINIER, Natural language processing for online applications:
text retrieval, extraction and categorization, John Benjamins Pub. 2002
(QA76.9 .N38 J33 Biblioteca UEM).
-
B. KRENN, C. SAMUELSSON, The Linguist's Guide to Statistics, sin publicar,
1997 (Disponible en
http://www.coli.uni-sb.de/~krenn/stat_nlp.ps.gz).
-
L. MORENO, M. PALOMAR, A. MOLINA, A. FERRÁNDEZ, Introducción
al Procesamiento del Lenguaje Natural, Servicio de Publicaciones Universidad
de Alicante, 1999 (P98 .I58 Biblioteca UEM).
-
G. SALTON, Introduction to Modern Information Retrieval, McGraw-Hill,
1983.
-
G. SALTON, Automatic Text Processing: The Transformation, Analysis, and
Retrieval of Information by Computer, Addison Wesley, 1989.
-
S. SHAPIRO, Encyclopedia of artificial intelligence, John Wiley &
Sons, 1992 (Q334.2 .E53 Biblioteca UEM).
-
C.J. VAN RIJSBERGEN, Information Retrieval, Butterworths, 1979 (Disponible
en
http://www.dcs.gla.ac.uk/Keith/Preface.html).
-
I. WITTEN, E. FRANK, Data Mining: Practical Machine Learning Tools and
Techniques with Java Applications, Morgan Kaufmann Publishers, 1999 (QA76.9
.D3 W58 Biblioteca UEM).
-
Artículos
-
Enlaces seleccionados
-
Asociaciones
-
Grupos, departamentos e institutos
-
Cursos
-
Listas de enlaces y motores de búsqueda especializados
Nota para el grupo de plan 1996: Los criterios de evaluación
definidos para este grupo coinciden en su totalidad con los usados en el
grupo del plan 2000. Sin embargo, dada la diferencia de créditos entre
ambas asignaturas, los alumnos de la presente deberán complementar
su trabajo en la misma por medio de un trabajo de investigación de
3 créditos, que se fijara de acuerdo con el profesor al inicio de
la asignatura.
Nota sobre las transparencias: Los alumnos deberán asumir que
el material proporcionado por el profesor (apuntes de cátedra,
transparencias) no reflejan en ningún caso los contenidos de la
asignatura, debiendo ser completados por medio de los apuntes obtenidos en
las clases impartidas por el profesor, y por medio del estudio y
documentación suplementaria (incluyendo especialmente la
bibliografía).
José María Gómez
Hidalgo - Universidad Europea de Madrid