Aprendiendo a usar el Terminal
En este taller aprenderás a utilizar el Terminal para llevar a cabo diversas tareas interesantes relacionadas con la lingüística de corpus: listas de frecuencias, búsquedas y reemplazos complejos, cambios de codificación de caracteres, etc.
Inscribirme ahoraAcceso permanente a los vídeos y 1 año de acceso al foro de dudas.
¿Qué vas a conseguir con este curso?
Este taller es una introducción al uso del Terminal (o intérprete de comandos), la pantalla con fondo negro o blanco utilizada habitualmente por algunos informáticos. Explicaremos su uso desde cero, centrándonos especialmente en los comandos particularmente útiles para realizar tareas relacionadas con la lingüística de corpus.
Trabajar con el Terminal y usar diferentes comandos para tareas de lingüística de corpus
Realizar cambios de codificación de caracteres en múltiples archivos
Generar listas de frecuencias a partir de ficheros de texto
Hacer búsquedas y reemplazos complejos usando expresiones regulares
Trabajar con corpus en diferentes formatos (CSV, XML, etc.)
Contenido y programa
El taller consiste en 14 horas de vídeos grabados, en las que Mario va explicando los diferentes conceptos y va guiando los diferentes ejercicios prácticos. Para sacarle partido a este taller es imprescindible ir haciendo los ejercicios que se van planteando.
Introducción y preparativos
Introducción y preparativos
Conceptos básicos y configuración del entorno de trabajo.
- ¿Qué es el Terminal? Origen y conceptos fundamentales
- ¿Qué son los comandos? ¿Qué podemos hacer con ellos?
- Tipos de ficheros y formato CSV
- Instalación y configuración del Terminal
- Instalación y configuración de Visual Studio Code
- Preparación del entorno de trabajo
Ficheros y carpetas
Ficheros y carpetas
Navegación y gestión del sistema de archivos.
- Estructura de carpetas y rutas
- Comandos iniciales: ls, cd y pwd
- Comodines
- Búsquedas de ficheros y carpetas
Contenido de los ficheros
Contenido de los ficheros
Manipulación y transformación de archivos de texto.
- Codificación de caracteres
- Cambios de codificación: comandos recode, dos2unix y unix2dos
- Ver contenido de los ficheros: cat
- Ejercicios con corpus reales: ESLORA, CORPES, CREA, XIADA, PRESSEA y Proyecto Gutemberg
- Comandos: cat, head, tail, wc, cut, sort y uniq
- Entrada/salida estándar y tuberías
- Comandos: tr, grep, sed y paste
Expresiones regulares
Expresiones regulares
Búsquedas y reemplazos avanzados con patrones.
- Literales
- Clases
- Anclas
- Alternativas
- Repetición y opcionalidad
- Elementos especiales
- Referencias
- Caracteres especiales
- Ejercicios prácticos de expresiones regulares
Manejo de corpus
Manejo de corpus
Técnicas avanzadas para trabajar con corpus lingüísticos.
- Trabajar con muchos ficheros a la vez
- Trabajar con ficheros etiquetados en formato CSV
- Validar y estandarizar campos
- Trabajar con concordancias en formato CSV
- Trabajar con ficheros XML
- Trabajar con otros formatos
Asistente virtual y contenido extra
Asistente virtual y contenido extra
Uso de IA y recursos adicionales.
- Asistente virtual: visión general, recomendaciones y ejemplos
- Recetas de acceso rápido
- Buscar ficheros en todo el ordenador
- Eliminar la primera línea de muchos ficheros a la vez
- Google Colab
- Terminal para el día a día: reducir el tamaño de un fichero PDF
¿A quién va dirigido?
- A estudiantes de grado, máster o doctorado en lingüística y otras áreas de conocimiento próximas.
- A cualquier lingüista que trabaje con corpus.
¿Es para principiantes?
Este taller está pensado para personas que no saben absolutamente nada del Terminal, así que, en líneas generales, si trabajas con corpus, sueles necesitar hacer búsquedas o reemplazos automáticos en varios ficheros a la vez o quieres aprender a generar listas de frecuencias a partir de ficheros de texto, entendemos que le vas a sacar mucho partido a este curso.
Adicionalmente, aunque el taller se centra en la realización de ejemplos relacionados con la lingüística de corpus, los conocimientos adquiridos se pueden emplear en muchos otros contextos.
Domina el Terminal para trabajar con corpus lingüísticos
(impuestos incluidos)
Inscribirme ahoraInstructor

Mario Barcala
Doctor en computación
El taller es impartido por Mario Barcala, director de NLPgo Technologies, S.L. y docente en diferentes cursos, talleres y seminarios para lingüistas.
Mario es doctor en computación, especializado en lingüística computacional, y cuenta con una amplia experiencia tanto en el desarrollo de aplicaciones informáticas en el área de la lingüística como en la impartición de talleres para lingüistas.
Esta doble perspectiva técnica y lingüística permite explicar el Terminal con rigor, pero en un lenguaje accesible y conectado con las necesidades reales de quienes trabajan con corpus.
Preguntas frecuentes
¿Es necesario tener algún conocimiento previo para realizar el taller?
Este taller es de carácter introductorio y no es necesario ningún conocimiento previo para realizarlo. Solo necesitas saber que un corpus es un conjunto de textos, codificados digitalmente, que comparten algunas características, y que los corpus permiten la realización de diferentes tipos de estudios.
¿Qué necesito para seguir el taller?
Para seguir el taller necesitas un ordenador con Windows 10, Windows 11, Mac OS X o Linux (cualquier distribución) y un navegador. En los primeros vídeos explicamos cómo instalar el resto de aplicaciones necesarias para realizar el taller.
¿Qué pasa si me quedo con dudas?
Si te surge cualquier duda o problema durante la realización del taller, tenemos dos mecanismos de comunicación habilitados en la plataforma: puedes enviar mensajes privados directamente a Mario o participar en un foro de dudas donde tanto Mario como otros/as compañeros/as del taller irán resolviendo todas las cuestiones que vayan surgiendo.
¿Cómo debo seguir el taller para aprovecharlo al máximo?
Para sacarle partido a este taller es imprescindible ir haciendo los ejercicios que se van planteando, es decir, hay que meterse en harina. Si haces esto, te garantizamos que este taller te resultará de mucha utilidad.