Palabras binarias
Informática para lingüistas

Transcripción

Bienvenidos y bienvenidas a palabras binarias, el espacio de informática para lingüistas. Aquí os contaremos algunas cosas interesantes relacionadas con la lingüística de corpus, la lingüística computacional y la informática en general.

En este vídeo vamos a explicar los conceptos de palabra ortográfica y elemento gramatical, que aparecen en algunos sistemas de consulta en corpus, y completaremos las explicaciones haciendo algunas búsquedas en un sistema de consulta en corpus que maneje estos conceptos. Vamos allá.

Bien. Por un lado tenemos las palabras ortográficas, o si queréis, simplemente palabras, que según el diccionario de la RAE son las unidades lingüísticas, dotadas generalmente de significado, que se separan de las demás mediante pausas potenciales en la pronunciación y blancos de escritura.

Es decir, que si simplificamos, si pensamos en textos escritos, las palabras son las secuencias de caracteres situadas entre espacios en blanco y signos de puntuación.

Así, en la oración que vemos ahí, "María Jesús, la hermana del alcalde, fue a dárselo en la mano", tendríamos las palabras: María, Jesús, la, hermana, del, alcalde, fue, a, dárselo, en, la y mano. Es decir, doce palabras ortográficas.

Por otro lado tenemos los elementos gramaticales, que podríamos definir de forma simplificada como los elementos del texto a los que se les puede asignar una categoría gramatical: sustantivo, verbo, preposición, determinante, etc.

En la oración que vimos anterioremente, que la vemos ahí en pantalla, los elementos gramaticales serían: María Jesús (sustantivo), la (determinante), hermana (sustantivo), de (preposición), el (determinante), alcalde (sustantivo), fue (verbo), a (preposición), dar (verbo), se (pronombre), lo (pronombre), en (preposición), la (determinante) y mano (sustantivo). Es decir, habría catorce elementos gramaticales, ya que, como se puede apreciar, un nombre propio compuesto constituiría un único elemento gramatical y las contracciones y verbos con pronombres enclíticos son divididos en sus constituyentes.

Bien, ¿y como afecta esto a las búsquedas en corpus? Pues vamos a verlo en el sistema de búsquedas del corpus CAES, el Corpus de Aprendices del Español, que está disponible en la dirección http://galvan.usc.es/caes.

Si abrimos la página y vamos a la pestaña del menú "Búsqueda", podemos ver que, a la izquierda, si no indicamos lo contrario, está establecido el tipo de búsqueda "Elem. gramaticales", es decir, las búsquedas por elementos gramaticales.

Vamos a cambiar el tipo de búsqueda a "Palabras ortográficas" y vamos a buscar "dárselo", que es una de las palabras del ejemplo. Vemos que aparece una única vez en "ahorrar mucho dinero para poder dárselo a su familia". Si ahora intentamos hacer la misma búsqueda en elementos gramaticales, y metemos en el primer elemento gramatical "dárselo", vemos que no obtenemos resultado.

Si este resultado nos pilla de sorpresa, debemos recordar qué son los elementos gramaticales. En la diapositiva anterior vimos que "dárselo" está compuesto de tres elementos gramaticales: "dar", "se" y "lo" y, por lo tanto, son esos los elementos que se pueden buscar en la aplicación de búsquedas. Si volvemos a la búsqueda, y buscamos los elementos "dar", seguido del elemento "se" y seguido del elemento "lo", obtenemos el resultado esperado, el que coincide con la búsqueda de palabras ortográficas que hemos hecho anteriormente.

De igual modo podríamos proceder, por ejemplo, si quisiéramos buscar la contracción "del", buscando el elemento gramatical "de" seguido del elemento gramatical "el". Y aquí nos saldrían las ocurrencias de "del".

Y hasta aquí el vídeo de hoy. Espero que os haya quedado un poco más claro esto de las palabras ortográficas y los elementos gramaticales, al menos en el contexto de la consulta de un corpus. Recordad que si queréis que os avisemos cuando publiquemos algún nuevo vídeo o artículo o queréis estar informados de los cursos de formación para lingüistas que impartimos, podéis suscribiros a nuestro boletín informativo en la campanita que aparece en nuestra página web www.palabrasbinarias.com. Allí tenéis el botón para suscribiros. Hasta la próxima.