Definición de desambiguación en estudios lingüísticos

En lingüística, la desambiguación es el proceso de determinar qué sentido de un palabra se está utilizando en un particular contexto. También conocido como desambiguación léxica.

En lingüística computacional, este proceso discriminativo se llama desambiguación del sentido de la palabra (WSD).

Ejemplos y observaciones

"Sucede que nuestro comunicación, en diferentes idiomas igualmente, permite que la misma forma de palabra se use para significar cosas diferentes en transacciones comunicativas individuales. La consecuencia es que uno tiene que averiguar, en una transacción particular, el significado pretendido de una palabra dada entre sus sentidos potencialmente asociados. Mientras que la ambigüedades que surgen de tales asociaciones múltiples de forma-significado están en el léxico nivel, a menudo tienen que resolverse por medio de un contexto más amplio desde el discurso incrustando la palabra. Por lo tanto, los diferentes sentidos de la palabra 'servicio' solo podrían distinguirse si uno pudiera mirar más allá de la palabra misma, como contrastando 'el servicio de jugador en Wimbledon 'con' servicio de camarero en Sheraton '. Este proceso de identificar los significados de las palabras en un discurso es generalmente conocido como

instagram viewer

sentido de la palabra desambiguación (WSD) ". (Oi Yee Kwong, Nuevas perspectivas sobre estrategias computacionales y cognitivas para la desambiguación del sentido de las palabras. Springer, 2013)

Desambiguación léxica y desambiguación del sentido de la palabra (WSD)

"Léxico desambiguación en su definición más amplia es nada menos que determinar el significado de cada palabra en contexto, lo que parece ser un proceso en gran parte inconsciente en las personas. Como problema computacional, a menudo se describe como 'AI completo', es decir, un problema cuya solución presupone una solución para completar lenguaje natural comprensión o razonamiento de sentido común (Ide y Véronis 1998).

"En el campo de la lingüística computacional, el problema generalmente se llama desambiguación del sentido de la palabra (WSD) y se define como el problema de determinar computacionalmente qué `` sentido '' de una palabra se activa mediante el uso de la palabra en una determinada contexto. WSD es esencialmente una tarea de clasificación: los sentidos de las palabras son las clases, el contexto proporciona la evidencia, y cada aparición de una palabra se asigna a una o más de sus posibles clases en función de la evidencia. Esta es la caracterización tradicional y común de WSD que lo ve como un proceso explícito de desambiguación con respecto a un inventario fijo de sentidos de las palabras. Se supone que las palabras tienen un conjunto de sentidos finito y discreto de un diccionario, una base de conocimiento léxico, o una ontología (en esta última, los sentidos corresponden a conceptos que una palabra lexicaliza). También se pueden utilizar inventarios específicos de la aplicación. Por ejemplo, en un entorno de traducción automática (MT), uno puede tratar las traducciones de palabras como sentidos de palabras, un enfoque que se está volviendo cada vez más factible debido a la disponibilidad de grandes paralelo corpora que pueden servir como datos de entrenamiento. El inventario fijo de WSD tradicional reduce la complejidad del problema, pero existen campos alternativos.. .. "(Eneko Agirre y Philip Edmonds," Introducción ". Desambiguación del sentido de la palabra: algoritmos y aplicaciones. Springer, 2007)

Homonimia y desambiguación

"Léxico desambiguación es especialmente adecuado para casos de homonimia, por ejemplo, una ocurrencia de bajo debe asignarse a cualquiera de los elementos léxicos bajo₁ o bajo₂, dependiendo del significado pretendido.

“La desambiguación léxica implica una elección cognitiva y es una tarea que inhibe los procesos de comprensión. Debe distinguirse de los procesos que conducen a una diferenciación de los sentidos de las palabras. La primera tarea se realiza de manera bastante confiable también sin mucha información contextual, mientras que la segunda no (cf. Veronis 1998, 2001). También se ha demostrado que las palabras homónimas, que requieren desambiguación, ralentizan el acceso léxico, mientras que las palabras polisémicas, que activan una multiplicidad de sentidos de palabras, aceleran el acceso al léxico (Rodd e.a. 2002).

"Sin embargo, tanto la modificación productiva de los valores semánticos como la elección directa entre elementos léxicamente diferentes han en común que requieren información adicional no léxica "(Peter Bosch," Productividad, polisemia e indexicalidad de predicados ". Lógica, lenguaje y computación: 6to Simposio internacional de Tbilisi sobre lógica, lenguaje y computación, ed. por Balder D. ten Cate y Henk W. Zeevat. Springer, 2007)

La desambiguación de categorías léxicas y el principio de verosimilitud

"Corley y Crocker (2000) presentan un modelo de amplia cobertura de categoría léxicadesambiguación basado en el Principio de probabilidad. Específicamente, sugieren que para una oración que consta de palabras w₀... w_norte, el procesador de sentencias adopta el más probable Parte del discurso secuencia t₀... t_norte. Más específicamente, su modelo explota dos probabilidades simples: (I) la probabilidad condicional de palabra w_I dada una parte particular del discurso t_I, y (ii) la probabilidad de t_I dada la parte anterior del discurso t_i-1. A medida que se encuentra cada palabra de la oración, el sistema le asigna esa parte del discurso t_I, que maximiza el producto de estas dos probabilidades. Este modelo capitaliza la percepción de que muchos sintáctico las ambigüedades tienen una base léxica (MacDonald et al., 1994), como en (3):

(3) Los precios / marcas de almacén son más económicos que el resto.

"Estas oraciones son temporalmente ambiguas entre una lectura en la que precios o marcas es el verbo principal o parte de un sustantivo compuesto. Después de haber sido entrenado en un corpus grande, el modelo predice la parte más probable del discurso para precios, teniendo en cuenta correctamente el hecho de que las personas entienden precio como sustantivo pero marcas como verbo (ver Crocker & Corley, 2002, y las referencias allí citadas). El modelo no solo da cuenta de una gama de preferencias de desambiguación arraigadas en la categoría léxica ambigüedad, también explica por qué, en general, las personas son muy precisas a la hora de resolver tales ambigüedades ". (Mateo W. Crocker, "Modelos racionales de comprensión: abordar la paradoja del rendimiento". Psicolingüística del siglo XXI: cuatro piedras angulares, ed. por Anne Cutler. Lawrence Erlbaum, 2005)