This article needs additional citations for verification. (April 2020) |
Part of a series on |
Reading |
---|
En lingüística , un grafema es la unidad funcional más pequeña de un sistema de escritura . [1] La palabra grafema se deriva del griego antiguo gráphō ('escribir'), y el sufijo -eme por analogía con fonema y otras unidades emicas . El estudio de los grafemas se llama grafémica . El concepto de grafema es abstracto y similar a la noción en computación de un carácter . En comparación, una forma específica que representa cualquier grafema particular en un tipo de letra dado se llama glifo .
Hay dos conceptos principales de grafema opuestos. [2]
En la denominada concepción referencial , los grafemas se interpretan como las unidades más pequeñas de la escritura que corresponden a los sonidos (más exactamente, los fonemas ). En este concepto, la sh en la palabra inglesa escrita shake sería un grafema porque representa el fonema /ʃ/ . Este concepto referencial está vinculado a la hipótesis de la dependencia que afirma que la escritura simplemente representa el habla.
Por el contrario, el concepto analógico define los grafemas de forma análoga a los fonemas, es decir, a través de pares mínimos escritos como shake vs. snake . En este ejemplo, h y n son grafemas porque distinguen dos palabras. Este concepto analógico está asociado con la hipótesis de autonomía que sostiene que la escritura es un sistema en sí mismo y debe estudiarse independientemente del habla. Ambos conceptos tienen debilidades. [3]
Algunos modelos se adhieren a ambos conceptos simultáneamente al incluir dos unidades individuales, [4] a las que se les dan nombres como grafema grafémico para el grafema según la concepción analógica ( h en shake ), y grafema de ajuste fonológico para el grafema según el concepto referencial ( sh en shake ). [5]
En conceptos más nuevos, en los que el grafema se interpreta semióticamente como un signo lingüístico diádico , [6] se define como una unidad mínima de escritura que es a la vez léxicamente distintiva y se corresponde con una unidad lingüística ( fonema , sílaba o morfema ). [7]
Los grafemas se suelen escribir entre corchetes angulares , p. ej., ⟨a⟩ . [8] Esto es análogo a la notación de barra /a/ que se utiliza para los fonemas . De manera análoga a la notación de corchetes [a] que se utiliza para los fonemas , los glifos a veces se denotan con líneas verticales, p. ej., | ɑ | . [9]
De la misma manera que las formas superficiales de los fonemas son sonidos del habla o fonos (y los diferentes fonos que representan el mismo fonema se denominan alófonos ), las formas superficiales de los grafemas son glifos (a veces grafos ), es decir, representaciones escritas concretas de símbolos (y los diferentes glifos que representan el mismo grafema se denominan alógrafos ).
De este modo, un grafema puede considerarse como una abstracción de una colección de glifos que son todos funcionalmente equivalentes.
Por ejemplo, en inglés escrito (u otros idiomas que usan el alfabeto latino ), hay dos representaciones físicas diferentes de la letra latina minúscula "a": " a " y " ɑ ". Sin embargo, dado que la sustitución de cualquiera de ellas por la otra no puede cambiar el significado de una palabra, se consideran alógrafos del mismo grafema, que puede escribirse ⟨a⟩ . De manera similar, el grafema correspondiente al "número arábigo cero" tiene una identidad semántica y un valor Unicode únicos U+0030
, pero exhibe variación en la forma de cero con barra . Las formas de letra cursiva y negrita también son alográficas, al igual que la variación observada en las formas serif (como en Times New Roman ) versus sans-serif (como en Helvetica ).
Existe cierto desacuerdo sobre si las letras mayúsculas y minúsculas son alógrafos o grafemas distintos. Las mayúsculas se encuentran generalmente en ciertos contextos desencadenantes que no cambian el significado de una palabra: un nombre propio, por ejemplo, o al principio de una oración, o todo en mayúsculas en un titular de periódico. En otros contextos, la mayúscula puede determinar el significado: compare, por ejemplo, polaco y polaco : el primero es un idioma, el segundo es para lustrar zapatos.
Algunos lingüistas consideran que los dígrafos como el ⟨sh⟩ en ship son grafemas distintos, pero estos generalmente se analizan como secuencias de grafemas. Sin embargo, las ligaduras no estilísticas , como ⟨æ⟩ , son grafemas distintos, al igual que varias letras con diacríticos distintivos , como ⟨ç⟩ .
Los glifos idénticos no siempre representan el mismo grafema. Por ejemplo, las tres letras ⟨A⟩ , ⟨А⟩ y ⟨Α⟩ parecen idénticas pero cada una tiene un significado diferente: en orden, son la letra latina A , la letra cirílica Azǔ/Азъ y la letra griega Alpha . Cada una tiene su propio punto de código en Unicode: U+0041 A LETRA A MAYÚSCULA LATINA , U+0410 A LETRA A MAYÚSCULA CIRÍLICA y U+0391 Α LETRA ALFA MAYÚSCULA GRIEGA .
This section needs additional citations for verification. (December 2022) |
Los principales tipos de grafemas son los logogramas (denominados con más precisión morfogramas [10] ), que representan palabras o morfemas (por ejemplo, los caracteres chinos , el ampersand "&" que representa la palabra y los números arábigos ); los caracteres silábicos , que representan sílabas (como en el kana japonés ); y las letras alfabéticas , que corresponden aproximadamente a fonemas (véase la siguiente sección). Para una discusión completa de los diferentes tipos, véase Sistema de escritura § Clasificación funcional .
Existen componentes grafémicos adicionales que se utilizan en la escritura, como los signos de puntuación , los símbolos matemáticos , los separadores de palabras como el espacio y otros símbolos tipográficos . Las escrituras logográficas antiguas solían utilizar determinativos mudos para desambiguar el significado de una palabra vecina (no muda).
Como se ha mencionado en la sección anterior, en las lenguas que utilizan sistemas de escritura alfabéticos , muchos de los grafemas representan en principio los fonemas (sonidos significativos) de la lengua. En la práctica, sin embargo, las ortografías de dichas lenguas implican al menos una cierta desviación del ideal de correspondencia exacta grafema-fonema. Un fonema puede representarse mediante un multigrafo (secuencia de más de un grafema), como el dígrafo sh representa un único sonido en inglés (y a veces un único grafema puede representar más de un fonema, como ocurre con la letra rusa я o la c española). Algunos grafemas pueden no representar ningún sonido (como la b en inglés debt o la h en todas las palabras españolas que contienen dicha letra), y a menudo las reglas de correspondencia entre grafemas y fonemas se vuelven complejas o irregulares, en particular como resultado de cambios históricos de sonido que no se reflejan necesariamente en la ortografía. Las ortografías "superficiales", como las del español estándar y del finlandés, tienen una correspondencia relativamente regular (aunque no siempre biunívoca) entre grafemas y fonemas, mientras que las del francés y del inglés tienen una correspondencia mucho menos regular y se conocen como ortografías profundas .
Los multigrafos que representan un solo fonema normalmente se tratan como combinaciones de letras separadas, no como grafemas por derecho propio. Sin embargo, en algunos idiomas un multigrafo puede ser tratado como una sola unidad a los efectos de la cotejación ; por ejemplo, en un diccionario checo , la sección para las palabras que comienzan con ⟨ch⟩ viene después de la de ⟨h⟩ . [11] Para más ejemplos, véase Orden alfabético § Convenciones específicas del idioma .