Palabras binarias
Informática para lingüistas

Permanente 7/24

En liña

14h

Prazas ilimitadas

130€ (impostos aplicables incluídos).

Idioma: Español

A quen vai dirixido?

  • A estudantes de grao, máster ou doutoramento en lingüística e outras áreas de coñecemento próximas.
  • A calquera lingüista que traballe con corpus.

De que trata o taller?

Este taller é unha introdución ao uso do Terminal (ou intérprete de comandos), a pantalla con fondo negro ou branco utilizada habitualmente por algúns informáticos. Explicaremos o seu uso desde cero, centrándonos especialmente nos comandos particularmente útiles para realizar tarefas relacionadas coa lingüística de corpus: cambio de codificación de caracteres, listaxes de frecuencias, buscas e reemprazos, etc.

Eu non teño nin idea de que vai isto, é este taller para min?

Este taller está pensado para persoas que non saben absolutamente nada do Terminal, así que, en liñas xerais, se traballas con corpus, soes necesitar facer buscas ou reemprazos automáticos en varios ficheiros á vez ou queres aprender a xerar listas de frecuencias a partir de ficheiros de texto, entendemos que lle vas sacar moito partido a este curso.

Adicionalmente, aínda que o taller se centra na realización de exemplos relacionados coa lingüística de corpus, os coñecementos adquiridos pódense empregar en moitos outros contextos.

Que aprenderei?

Aprenderás a traballar co Terminal e a usar diferentes comandos para realizar tarefas relacionadas coa lingüística de corpus.

É necesario ter algún coñecemento previo para realizar o taller?

Este taller ten carácter introdutorio e non é necesario ningún coñecemento previo para realizalo. So necesitas saber que un corpus é un conxunto de textos, codificados dixitalmente, que comparten algunhas características, e que os corpus permiten a realización de diferentes tipos de estudos.

Que necesito para seguir o taller?

Para seguir o taller necesitas un ordenador con Windows 10, Windows 11, Mac OS X ou Linux (calquera distribución) e un navegador. Nos primeiros vídeos explicamos como instalar o resto de aplicacións necesarias para realizar o taller.

Quen é o docente que imparte o taller?

O docente que imparte o taller é Mario Barcala, director de NLPgo Technologies, S.L. e docente en diferentes cursos, talleres e seminarios para lingüistas. Mario é doutor en computación, especializado en lingüística computacional, e conta cunha ampla experiencia, tanto no desenvolvemento de aplicacións informáticas na área da lingüística como na impartición de talleres para lingüistas.

Organización

O taller consiste en 14 horas de vídeos grabados, nas que Mario vai explicando os diferentes conceptos e vai guiando os diferentes exercicios prácticos. Para sacarlle partido a este taller é imprescindible ir facendo os exercicios que se van plantexando, é decir, hai que meter as mans na masa. Se fas isto, garantizámosche que este taller che vai resultar de moita utilidade.

Se che xorde calquera dúbida ou problema durante a realización do taller, temos dous mecanismos de comunicación habilitados na plataforma: podes enviar mensaxes privadas directamente a Mario ou participar nun foro de dúbidas onde tanto Mario como outros/as compañeiros/as do taller irán resolvendo todas as cuestións que vaian xurdindo.

Índice de contidos

  1. Introdución:
    1. Que é o Terminal?
    2. Orixe.
    3. Que son os comandos?
    4. Que podemos facer cos comandos?
    5. Tipos de ficheiros.
    6. Formato CSV.
  2. Preparativos:
    1. Instalación e configuración do Terminal.
    2. Instalación e configuración de Visual Studio Code.
    3. Preparación da contorna de traballo.
  3. Ficheiros e cartafois:
    1. Estrutura de cartafois.
    2. Roteiros.
    3. Comandos iniciais: ls, cd e pwd.
    4. Comodíns.
    5. Buscas de ficheiros e carpetas.
  4. Contido dos ficheiros:
    1. Codificación de caracteres.
    2. Cambios de codificación de caracteres: comandos recode, dos2unix e unix2dos.
    3. Ver contido dos ficheiros: cat
    4. Exercicios de codificación de caracteres relacionados cos corpus ESLORA, CORPES, CREA, XIADA, PRESSEA e Proyecto Gutemberg.
    5. Comandos: cat, head, tail, wc, cut, sort y uniq.
    6. Entrada/saída estándar.
    7. Tubaxes.
    8. Comandos: tr, grep, sed y paste.
    9. Exercicios de comandos que actúan sobre o contido dos ficheiros.
  5. Expresións regulares:
    1. Literais.
    2. Clases.
    3. Áncoras.
    4. Alternativas.
    5. Repetición e opcionalidade.
    6. Elementos especiais.
    7. Referencias.
    8. Caracteres especiais.
    9. Exercicios de expresións regulares.
  6. Manexo de corpus:
    1. Traballar con moitos ficheiros á vez.
    2. Traballar con ficheiros etiquetados en formato CSV.
    3. Validar e estandarizar campos.
    4. Traballar con concordancias en formato CSV.
    5. Traballar con ficheiros XML.
    6. Traballar con outros formatos.
  7. Asistente virtual:
    1. Visión xeral.
    2. Recomendacións xerais.
    3. Exemplos.
  8. Conclusións.
  9. Bibliografía.