Este artículo necesita citas adicionales para su verificación . ( abril de 2024 ) |
Una representación lingüística simbólica es una representación de un enunciado que utiliza símbolos para representar información lingüística sobre el enunciado, como información sobre fonética , fonología , morfología , sintaxis o semántica . Las representaciones lingüísticas simbólicas son diferentes de las representaciones no simbólicas, como las grabaciones, porque utilizan símbolos para representar información lingüística en lugar de mediciones.
Las representaciones simbólicas se utilizan ampliamente en lingüística. En las representaciones sintácticas , los símbolos de categoría atómica a menudo se refieren a la categoría sintáctica de un elemento léxico . Los ejemplos incluyen categorías léxicas como verbos auxiliares ( INFL ), [1] categorías sintácticas como cláusulas relativas ( SRel ) y categorías vacías como trazas wh ( t WH ). Patente de EE. UU. 10133724 En algunos formalismos, como la gramática funcional léxica , estos símbolos pueden referirse tanto a funciones gramaticales como a valores de categorías gramaticales . En lingüística, las categorías vacías se representan con ∅ .
Las representaciones simbólicas también aparecen en la transcripción fonética , descripciones de procesos fonológicos, troqueos , fonemas , morfofonemas, clases naturales , características semánticas como la animicidad y las estructuras qualia de la Teoría del Léxico Generativo . [2]
En el procesamiento del lenguaje natural, las representaciones lingüísticas, como las representaciones sintácticas, han estado durante mucho tiempo al servicio de mejorar el resultado de los sistemas de recuperación de información, como los motores de búsqueda y los sistemas de traducción automática. [3] Recientemente, en el análisis de constituyentes neuronales basado en span, los elementos léxicos comienzan como tokens de fragmentos de palabras o tiktokens BPE antes de transformarse en varias otras representaciones: vectores de palabras (codificador de palabras), nodos terminales (vectores span, postes de cerca), nodos no terminales (clasificador span), árbol de análisis (CKY neuronal). Se sugiere que el mapeo de terminales a no terminales aprende qué construcciones están permitidas por el lenguaje. [4]
Las representaciones lingüísticas simbólicas se utilizan con frecuencia en la lingüística computacional . [ cita requerida ]
Otras representaciones en lingüística que no son símbolos ni medidas incluyen reglas y clasificaciones .
Patente estadounidense 10133724, Sean L. Bethard; Edward G. Katz y Christopher Phipps, "Clasificación sintáctica de oraciones en lenguaje natural con respecto a un elemento específico", publicada el 20 de noviembre de 2018, asignada a International Business Machines Corp