Guionización: Comparativa das regras de guionización do galego e o español

De Wiki Mancomun

Introdución

Este documento elaborouse en colaboración con Imaxin|Software para analizar a posibilidade de empregar o guionizador do idioma español do OpenOffice.org para o idioma Galego.

Actualización

Mancomún publicou finalmente en febreiro de 2009 un guionizador que está dispoñíbel como extensión para openOffice.org xunto co corrector ortográfico de galego. Para a súa elaboración partiuse dunha estratexia tecnolóxica diferente á aquí presentada. En lugar de regras lingüísticas escolleuse utilizar un motor estatístico baseado nun corpus representativo de 5000 palabras guionizadas á man.

A información que seguinte segue sendo válida nos aspectos lingüísticos e mantense con idea documental desde o punto de vista lingüístico. Tal como se explica a continuación, queda aberta a calquera que queira colaborar a opción de construír un guionizador baseado en regras.

Documentación

Para isto cómpre facer unha comparación das regras de silabización de ambos os dous idiomas, para o que se empregaron as seguintes referencias:

  • Galego:
    • Normas ortográficas e morfolóxicas do idioma galego do ILG-RAG
    • Ortografía da lingua galega de B. González Rei


  • Español:
    • Diccionario panhispánico de dudas da RAE


As regras de silabización de ambas as linguas presentan algunhas diverxencias. Por ese motivo, aínda que en determinadas situacións as regras do Español poderían ser transferibles ao Galego, haberá casos que o guionizador español considere incorrectos quedando deste xeito limitadas as opcións posibles normativamente. Cómpre pois valorar estas diverxencias para a elaboración dun guionizador específico para o Galego. A continuación inclúese un cadro con algunhas das diferenzas.

Paquete de guionización para OpenOffice.org

Este paquete de guionización xurdiu dunha pregunta feita por un usuario dos foros de Mancomun.org.

Neste fío do foro atópase publicado o corrector ortográfico para OpenOffice.org que inclúe o soporte para guionización adaptado do español:

Corrector ortográfico 2.1 do OpenOffice.org e dicionario de separación por sílabas para o galego (adaptado da versión española).

A adaptación feita polo de agora foi tomar o ficheiro de guionización española e incluílo, sen máis que cambiándolle o nome, no paquete de corrección ortográfica do galego.

Agora habería que incluír nese ficheiro de guionización as regras expostas a continuación neste documento.

Comparativa das dúas regras

REGRAS CON DIVERXENCIAS

PROBLEMA PRÁCTICO (Exemplo)

GALEGO:

No caso de haber dúas vogais xuntas, non se poden separar cando forman ditongo crecente ou decrecente [...]. Poden separarse cando constitúen hiato: dí-/as, ra-/íña...

O guionizador español considerará incorrectas divisións silábicas que afecten hiatos.

En determinados contextos pode ser necesario facer uso disto en Galego.

Por exemplo, en Español é incorrecto *comerí- /an mais non en Galego. Ademais, debemos ter en conta os casos de palabras como viúvo ou xesuíta, que posúen máis sílabas en Galego que en Español (cfr. viudo, jesuita).

ESPAÑOL:

Dos o más vocales seguidas nunca se separan al final de renglón, formen diptongo, triptongo o hiato.

La única excepción se da si las vocales que van seguidas forman parte de dos elementos distintos de una palabra compuesta: contra- / espionaje, hispano- / americano.

GALEGO:

O h mudo interior de palabra, tanto se aparece en posición intervocálica como precedido de consoante, para os efectos de división a final de liña considérase unha consoante máis, é dicir, trátase como comezo de sílaba. Polo tanto, o guión colócase xusto diante do h e este pasa ao comezo da liña seguinte: apre-/hender, ve-/hemencia, ve-/hículo, alco-/holemia...

Neste caso a aplicación da regra do Español non incluiría as diferentes posibilidades resultantes da división silábica do Galego para estas palabras..

Formas incorrectas en Español mais correctas en Galego serían, por exemplo, *pro-/híben ou *ve-/hícu lo.

ESPAÑOL:

Para dividir con guión de final de línea las palabras que contienen una h intercalada, se actuará como si esta letra muda no existiese, aplicando las mismas reglas que para el resto de las palabras; por lo tanto, no podrán romperse sílabas ni secuencias vocálicas, salvo que se trate de palabras compuestas que cumplan los requisitos expuestos [...]: adhe- / rente (no *ad- / herente), al- / cohol (no *alco- / hol), prohí- / ben (no *pro- / híben)... [...]

GALEGO:

Os dous elementos dun dígrafo non se poden separar, por constituíren a representación dun único son: [... ] algu-/nha, ningu-/nha.

O guionizador español neste caso non recoñecería a secuencia <nh> como dígrafo.

ESPAÑOL:

En las palabras con hache intercalada no podrá aplicarse ninguna regla general que dé como resultado la presencia, a comienzo de renglón, de combinaciones gráficas extrañas; son, pues, inadmisibles divisiones como *desi- / nhibición, *de- / shumanizar, *clo- / rhidrato, *ma- / hleriano, pues, aunque se atienen a la regla de dividir las palabras por alguna de sus sílabas, dejan a principio de línea los grupos consonánticos nh, sh, rh, hl, ajenos al español.

GALEGO:

As secuencias bl, br, pl, pr, cl, cr, gl, gr, dr, tl, tr, fl e fr intervocálicas forman unha unidade e non se poden separar ao final da liña.En Galego sería incorrecta a división *at-/lántico, correcta en Español.

ESPAÑOL:

El grupo tl podrá separarse o no con guion de final de línea dependiendo de si las consonantes que lo componen se articulan en sílabas distintas o dentro de la misma sílaba: at- / leta, atle- / ta.

GALEGO:

As abreviaturas, siglas e acrónimos divídense a final de liña sempre que respecten as regras fundamentais de partición [...].

Segundo a regra do Español ad-món. e CO-SAL, por exemplo, deberían aparecer nunha mesma liña.

Eses casos recóllense como posibles en Galego no libro de B. González Rei.

ESPAÑOL:

Las abreviaturas y las siglas no se dividen nunca en renglones diferentes. Solo los acrónimos que se han incorporado al léxico general pueden dividirse con guion de final de línea: lá- / ser, ov- / nis.

ESPAÑOL: Se recomienda no dividir palabras de solo cuatro letras.

GALEGO: Entre os exemplos da bibliografía utilizada aquí para o Galego aparecen, entre outros, dí-/as e ta-/xi.

ESPAÑOL: Después de punto y seguido se procurará no dejar a final de línea una sílaba de menos de tres letras: Co- / mimos en una tasca muy barata. Mejor: Comi- / mos...

GALEGO: Na bibliografía utilizada para o Galego non se encontra esa recomendación.

ESPAÑOL: La última línea de un párrafo no deberá tener menos de cinco caracteres, sin contar el signo de puntuación que corresponda.

GALEGO: Na bibliografía utilizada para o Galego non se encontra esa recomendación.