Palabras binarias
Informática para lingüistas

Permanente 7/24

En línea

14h

Plazas ilimitadas

130€ (impuestos aplicables incluidos).

Idioma: Español

¿A quién va dirigido?

  • A estudiantes de grado, máster o doctorado en lingüística y otras áreas de conocimiento próximas.
  • A cualquier lingüista que trabaje con corpus.

¿De qué trata el taller?

Este taller es una introducción al uso del Terminal (o intérprete de comandos), la pantalla con fondo negro o blanco utilizada habitualmente por algunos informáticos. Explicaremos su uso desde cero, centrándonos especialmente en los comandos particularmente útiles para realizar tareas relacionadas con la lingüística de corpus: cambio de codificación de caracteres, listas de frecuencias, búsquedas y reemplazos, etc.

Yo no tengo ni idea de que va esto, ¿es este taller para mí?

Este taller está pensado para personas que no saben absolutamente nada del Terminal, así que, en líneas generales, si trabajas con corpus, sueles necesitar hacer búsquedas o reemplazos automáticos en varios ficheros a la vez o quieres aprender a generar listas de frecuencias a partir de ficheros de texto, entendemos que le vas a sacar mucho partido a este curso.

Adicionalmente, aunque el taller se centra en la realización de ejemplos relacionados con la lingüística de corpus, los conocimientos adquiridos se pueden emplear en muchos otros contextos.

¿Qué aprenderé?

Aprenderás a trabajar con el Terminal y a usar diferentes comandos para realizar tareas relacionadas con la lingüística de corpus.

¿Es necesario tener algún conocimiento previo para realizar el taller?

Este taller es de carácter introductorio y no es necesario ningún conocimiento previo para realizarlo. Solo necesitas saber que un corpus es un conjunto de textos, codificados digitalmente, que comparten algunas características, y que los corpus permiten la realización de diferentes tipos de estudios.

¿Qué necesito para seguir el taller?

Para seguir el taller necesitas un ordenador con Windows 10, Windows 11, Mac OS X o Linux (cualquier distribución) y un navegador. En los primeros vídeos explicamos cómo instalar el resto de aplicaciones necesarias para realizar el taller.

¿Quién es el docente que imparte el taller?

El docente que imparte el taller es Mario Barcala, director de NLPgo Technologies, S.L. y docente en diferentes cursos, talleres y seminarios para lingüistas. Mario es doctor en computación, especializado en lingüística computacional, y cuenta con una ámplia experiencia, tanto en el desarrollo de aplicaciones informáticas en el área de la lingüística como en la impartición de talleres para lingüistas.

Organización

El taller consiste en 14 horas de vídeos grabados, en las que Mario va explicando los diferentes conceptos y va guiando los diferentes ejercicios prácticos. Para sacarle partido a este taller es imprescindible ir haciendo los ejercicios que se van planteando, es decir, hay que meterse en harina. Si haces esto, te garantizamos que este taller te resultará de mucha utilidad.

Si te surge cualquier duda o problema durante la realización del taller, tenemos dos mecanismos de comunicación habilitados en la plataforma: puedes enviar mensajes privados directamente a Mario o participar en un foro de dudas donde tanto Mario como otros/as compañeros/as del taller irán resolviendo todas las cuestiones que vayan surgiendo.

Índice de contenidos

  1. Introducción:
    1. ¿Qué es el Terminal?
    2. Origen.
    3. ¿Qué son los comandos?
    4. ¿Qué podemos hacer con los comandos?
    5. Tipos de ficheros.
    6. Formato CSV.
  2. Preparativos:
    1. Instalación y configuración del Terminal.
    2. Instalación y configuración de Visual Studio Code.
    3. Preparación del entorno de trabajo.
  3. Ficheros y carpertas:
    1. Estructura de carpetas.
    2. Rutas.
    3. Comandos iniciales: ls, cd y pwd.
    4. Comodines.
    5. Búsquedas de ficheros y carpetas.
  4. Contenido de los ficheros:
    1. Codificación de caracteres.
    2. Cambios de codificación de caracteres: comandos recode, dos2unix y unix2dos.
    3. Ver contenido de los ficheros: cat
    4. Ejercicios de codificación de caracteres relacionados con los corpus ESLORA, CORPES, CREA, XIADA, PRESSEA y Proyecto Gutemberg.
    5. Comandos: cat, head, tail, wc, cut, sort y uniq.
    6. Entrada/salida estándar.
    7. Tuberías.
    8. Comandos: tr, grep, sed y paste.
    9. Ejercicios de comandos que actúan sobre el contenido de los ficheros.
  5. Expresiones regulares:
    1. Literales.
    2. Clases.
    3. Anclas.
    4. Alternativas.
    5. Repetición y opcionalidad.
    6. Elementos especiales.
    7. Referencias.
    8. Caracteres especiales.
    9. Ejercicios de expresions regulares.
  6. Manejo de corpus:
    1. Trabajar con muchos ficheros a la vez.
    2. Trabajar con ficheros etiquetados en formato CSV.
    3. Validar y estandarizar campos.
    4. Trabajar con concordancias en formato CSV.
    5. Trabajar con ficheros XML.
    6. Trabajar con otros formatos.
  7. Asistente virtual:
    1. Visión general.
    2. Recomendaciones generales.
    3. Ejemplos.
  8. Conclusiones.
  9. Bibliografía.