Resumen breve del contenido

En este vídeo vemos los primeros pasos con ELAN, una herramienta muy útil para lingüistas que necesitan transcribir, anotar y alinear audio con precisión.

Aprenderás cómo instalar ELAN, cómo abrir un archivo de audio, por qué puede ser recomendable trabajar con formato WAV en lugar de MP3, cómo crear líneas para distintos hablantes y cómo empezar a hacer una transcripción alineada con el audio.

También veremos algunos trucos básicos pero fundamentales para trabajar con más comodidad en ELAN, como ajustar selecciones con Mayúsculas o modificar los límites temporales de una anotación con Alt.

Este tutorial está pensado para lingüistas, estudiantes e investigadores que trabajan con corpus orales, entrevistas, grabaciones de campo o cualquier tipo de material lingüístico que necesite transcripción y alineamiento.

📩 Suscríbete para no perderte los próximos vídeos.

Enlaces de interés

Transcripción

¿Queréis aprender ELAN, la herramienta de anotación lingüística? Quedaos y vamos a ver los primeros pasos sobre cómo usar esta herramienta para transcribir y alinear audio. Esto es Palabras binarias: Informática para lingüistas. Vamos a verlo.

Bien, lo primero que vamos a hacer es instalar la herramienta. Vale, podemos buscar aquí en el propio Google, ELAN annotation tool. Vale, tenemos aquí The Language Archive, y aquí es la página oficial de ELAN donde podemos descargarlo aquí, en Download. Lo descargamos como una aplicación más. Tenéis aquí en Windows, Mac OS o Linux. En este caso estoy usando Windows, así que lo voy a descargar. El .exe, por ejemplo. Y lo vamos a instalar como una aplicación normal. No tiene mucha ciencia la instalación. Siguiente, siguiente, siguiente, instalar. Bien, y ya ha finalizado. Es facilito de instalar, simplemente es descargar el ejecutable y darle a instalar. Siguiente, siguiente y ya está. Y esto nos debería haber instalado la aplicación.

No veo por aquí ningún acceso directo. Vamos a buscarlo aquí, ELAN. Lo tenemos aquí. Le voy a decir anclar a la barra de tareas. Aquí, tareas, para que lo ponga aquí abajo. Y ya podemos arrancar la aplicación. Bien, una vez tenemos descargada e instalada la aplicación, tenemos que empezar a trabajar con un audio.

Yo tengo aquí dos audios que son el mismo. Uno MP3 y el otro WAV. Yo os recomiendo trabajar con el WAV. Si no sabéis cómo convertir, si lo tenéis en MP3 y no sabéis cómo convertirlo a WAV, tenemos un vídeo que acabamos de publicar hace poco en nuestro canal donde podéis ver cómo usando Audacity podéis convertir a casi cualquier formato. Un fichero de audio al formato que queráis. Ahora os explico, cuando arranque la herramienta, os explico un poco por qué creo que es mejor trabajar con el WAV.

Vale, entonces voy a arrancar la herramienta y veis que aquí cuando le damos archivo para crear uno nuevo, veis que en archivos de media, en todos los archivos que puedes utilizar, cuando pones el menú archivos de media, veis que aquí no sale MP3. Sale MOV, MP4 y WAV, pero no sale MP3. Bueno, por aquí salen otros formatos o un subconjunto de los formatos y, como en el pasado hemos tenido problemas con otra herramienta, no con esta, pero hemos tenido problemas por haber usado MP3 para hacer este alineamiento, yo casi os diría que es mejor usar el .WAV. Aquí podéis abrir el fichero a través del menú o se puede arrastrar. Si tú arrastras el MP3 va a funcionar. En general va a funcionar, pero yo tendría la precaución casi de usarlo en formato WAV porque me extraña que no salga allí entre los ficheros de media, digamos en el menú, que salga el formato. ¿Qué pasa? Que si lo haces con el MP3 no vas a tener la forma de la onda. Veréis que va a salir ahora cuando pase el WAV va a salir una forma de onda y si lo hacéis con el MP3, en principio la única diferencia es esa. Sabéis que el MP3 en general ocupa menos que el WAV y por lo tanto sería más cómodo, pero bueno, entre que no sale la onda y que a veces es útil para marcar los límites y que no tenemos... Bueno, no sale allí en el menú, a mí me da que sospechar un poco.

Entonces, bueno, vamos a escuchar un momentito el audio. "Los cambios de intensidad, de velocidad con las que hablamos. Se me ocurre a mí, en este caso desde el desconocimiento, el conseguir hablantes que se presten a... Bueno, curiosamente sí." Veis que hay dos hablantes, vamos a intentar transcribir todo el texto y asignarle cada uno de los hablantes... Perdón, el texto al hablante correspondiente.

No voy a entrar aquí a ver qué tipo de transcripciones hay, porque se puede hacer transcripción fonética, transcripción ortográfica, y dentro de la ortográfica qué cosas queremos transcribir, cómo las queremos transcribir, hay muchísimo debate sobre esto y no voy a entrar en este vídeo que es un poco de introducción a ELAN. Si queréis saber más sobre esto, sobre qué tipo de transcripciones hay, y qué tipo de transcripción me compensa según el objetivo que quiera del corpus, dejadnos un me gusta o dejadnos un comentario y profundizaremos un poco más. Ahora simplemente vamos a hacer una transcripción, pensad en una transcripción de tipo de unos subtítulos para el vídeo. Una transcripción de lo que están diciendo sin entrar en detalles de la oralidad, o sea, una transcripción ortográfica de lo que están diciendo. Sin más, como si fueran unos subtítulos simples. No voy a entrar ahora en la otra parte más compleja.

Entonces voy a mover ya el fichero WAV a la herramienta, se puede hacer así o se puede, insisto, con archivo nuevo, también podrías elegir el fichero y veis que tenemos ahí como tres zonas, diría yo. Lo voy a abrir un poquito. Tenemos aquí una zona que va cambiando en función de la pestaña en la que estamos, aquí nos vamos a centrar sobre todo aquí en los controles (volumen, velocidad) y, sobre todo, sí, queda aquí el volumen y velocidad, no vamos a usar mucho la parte de arriba en este vídeo introductorio. Aquí tenemos los controles del vídeo, el play, ir al principio, ir un segundo hacia atrás, yo no suelo usar todos, y luego, bueno, si ves que le damos aquí al play, veis que podemos escuchar el audio, "los cambios de inten", la pausa, este me gusta mucho porque es reproducir la selección, si yo pincho en un sitio, arrastro y le doy aquí, me reproduce solo ese fragmento, "intensidad de veloci", veis que reproduce solo eso, y luego aquí, que se puede ampliar, yo creo que es bastante interesante cuando estás transcribiendo, a veces para definir los límites nos va bien ver la onda, para saber de dónde a dónde llega lo que estamos pronunciando, y esto no aparece cuando usamos ficheros MP3, ¿vale?

Bien, entonces, ¿por dónde empezar? Lo primero es crear las líneas de los hablantes, las líneas, le llaman tiers en ELAN, aquí línea han traducido, en el inglés es tier, quería comentaros también que me parece un poco desafortunado la traducción a español, porque le llaman comentario a annotation, o sea, donde vamos a crear la información asociada al audio, en este caso una transcripción, pero podría ser otra cosa, le llaman comentarios, ¿vale? que viene del inglés annotation, yo creo que quizás anotación sería un poco más conveniente en este caso.

Entonces bueno, por si os despista, entonces voy a crear, la default la voy a borrar después, pero simplemente voy a crear una línea nueva, donde me dice nombre de la línea, pues le voy a llamar como el hablante, Hablante 1, y participante Hablante 1, bueno, el anotador, en principio no lo voy a registrar, aquí se podría poner mi nombre, o lo que sea, para decir quién está transcribiendo esa línea, ¿vale? Bien, vamos ahora a crear una segunda línea para el segundo hablante: línea, añadir nueva línea, nombre de la línea Hablante 2, participante Hablante 2, añadir, bien, ya tenemos las dos líneas, podemos borrar esta de default, con el botón derecho, creo que sí, suprimir default, no la voy a usar para nada, vale. Y ya tenemos aquí las líneas, ¿vale?

Entonces voy a empezar transcribiendo, Hablante 1 le voy a llamar al primero que interviene, y Hablante 2 al segundo que interviene. Conviene no transcribir todo en un annotation, o sea, yo puedo ahora aquí, aquí es muy interesante, la función que no es evidente, perdón, que se me cae aquí el auricular, no es evidente, pero es interesante, que para cambiar de hablante donde estás trabajando, con doble clic aquí, ¿vale? Quizás uno esperaría que simplemente haciendo clic simple ya se arreglaría, pero no, o sea, ya cambiarías de hablante, pero no, si estás trabajando con Hablante 1, doble clic, si estás trabajando con Hablante 2, doble clic aquí, vale.

Bien, Hablante 1 entonces, vamos a mover para el principio el cursor del audio, y lo que os decía, conviene segmentar la transcripción en intervenciones, ¿vale? Aquí tampoco, esto daría también para otro vídeo completo, pero no voy a entrar tampoco en profundidad, porque ya insisto en que es simplemente para ver las funciones básicas de ELAN, pero el tema es que la transcripción no puede ir toda corrida, ¿vale? Porque, si no, tampoco estaríamos alineando el inicio y el fin de cada intervención, ¿vale? Entonces lo vamos a hacer con intervenciones que tengan más o menos sentido para nosotros, pues una oración, un enunciado, algo, ¿vale? Ahora lo veréis haciendo el ejemplo.

Bien, vamos a escuchar el primer fragmento. "Los cambios de intensidad, de velocidad, con los que hablamos". Con los que hablamos, bueno, pues por aquí, un poquito antes, pinchamos y arrastramos hasta donde comienza, ¿vale? Aquí lo tenemos. Y entonces ahora, el tema es, bueno, podemos verla si lo tenemos bien elegido. "Los cambios de intensidad, de velocidad, con los que hablamos". Vale, aquí parece que dice algo más. Imaginaos que queremos mover esto un poquito a la izquierda y para esto ELAN es un poco..., no es nada intuitivo. Entonces, si yo ahora cojo aquí el extremo y lo muevo, deshace la selección, ¿vale? Si yo intento mover esto, ¿veis? Deshace la selección. Entonces, bueno, la dejo como estaba, por aquí, por donde sea. Y entonces ahora, si queremos corregir la posición, lo que tenemos es que pinchar mayúsculas y con las mayúsculas pinchadas ponemos donde queremos corregir. Por ejemplo, esto aquí. Ahí está. ¿Veis? Ya me corrigió la selección. Vamos a revisar. "Los cambios de intensidad, de velocidad, con los que hablamos". Podemos ajustar aún un poquito más. Insisto, ¿eh? Mayúsculas pulsadas y puedo corregir eso. "Los cambios de intensidad, de velocidad, con los que hablamos".

Vale. Y ahora aquí, comentario o annotation, nuevo comentario aquí, ¿vale? Y entonces ahora empezamos a transcribir. "Los cambios de intensidad, de velocidad, con los que hablamos". Los cambios de intensidad, de velocidad, con los que hablamos. "Los cambios de intensidad, de velocidad, con los que hablamos". Bueno, aquí dice dos veces de. Vamos a revisar. Vamos simplemente a reflejar ahí. A ver, otra vez. "Intensidad, con las que hablamos". Sí. "Los cambios de intensidad, de velocidad, con las que hablamos". Vale, bien. ¿Sí?, ¿hasta aquí bien?. Hemos hecho ya una transcripción. ¿Y qué hemos alineado? Hemos alineado a nivel de fragmento, ¿vale? No estamos alineando a nivel de palabra. Insisto, si queréis que profundicemos más en otros aspectos de ELAN, dejadnos un me gusta, dejadnos comentarios de qué queréis que veamos y profundizamos más. Estos son los primeros pasos. Hemos transcrito un fragmento del primer hablante. ¿Vale?

Podemos ahora seguir con el resto. Una cosa importante, igual que con mayúsculas, podemos cambiar la selección. Ahora puedo pinchar fuera y esto ya queda marcado. Si queremos corregir, una vez hecho esto, una vez ya hecho la anotación o el comentario, queremos corregir dónde acaba, hay otro truquito, que tampoco es nada intuitivo, que es con ALT. En lugar de... Mayúsculas, sirve para cambiar la selección. Pues con ALT podemos cambiar el extremo. Si yo pulso por aquí, ves que no hace nada, pero si yo mantengo pulsado ALT, cuando paso aquí por encima, veis que me aparece esta doble flecha. Y aquí sí que es arrastrando la doble flecha para adelante o para atrás. Yo corrijo la marca de tiempo en la que termina este fragmento. ¿Vale? Es imprescindible, yo creo, manejando ELAN, saber esta combinación: la de mayúsculas para cambiar la selección y la de ALT para cambiar, una vez ya tienes anotado, cambiar los extremos. Si no, nos volvemos locos intentando cambiar, bueno, afinar lo que tenemos ya hecho. ¿Vale?

Vamos a continuar. "Se me ocurre a mí, en este caso, desde el desconocimiento, el conseguir hablantes." Vale, ahí hay el segundo hablante. Se me ocurre a mí. Lo voy a poner desde aquí, por ejemplo. ¿Veis que puede haber solapamiento o no? Ahora vemos si está solapado o no. O sea, si la segunda voz empieza antes de que acabe el primer enunciado, la primera o no. Vamos a ver. "Bueno, que se presten a". Perdón, aquí. "Se me ocurre a mí, en este caso", aquí más o menos queda casi igual. Voy a usar las mayúsculas para corregir esto, a ver. Aquí. Perdón. "Se me ocurre a mí, en este caso" Fijaos que queda muy cortada el "se" ahí, si lo pongo justo ahí, esa "s" se pierde un poquito, entonces yo lo voy a solapar un poco. Lo voy a poner aquí, ¿vale? Un poquito más. Ese "se" ya está completo. ¿Veis que puedo hacer un solape aquí? Entonces voy al hablante 2 y en la selección esa le digo comentario, nuevo comentario aquí. Le voy a dar otra vez. Se me ocurre a mí, en este caso, desde el desconocimiento. "Desde el desconocimiento, el conseguir hablantes". El conseguir hablantes. Vale. Vamos a ver. Lo voy a repasar. Si pinchamos fuera ya se queda eso puesto. "Se me ocurre a mí, en este caso, desde el desconocimiento, el conseguir hablantes". Vale. Bien.

Y vamos ahora con la última parte. "Bueno, que se presten a..." Bueno, que se presten a... Lo voy a... Lo voy a ampliar. A ver. "Que se presten a..." Que se presten a... Fíjate, digo ahí. Lo voy a ampliar, ¿vale? Que forma parte, otra vez, el Alt, que forma parte de eso. Que se presten a... A ver si es aquí. "Se me ocurre a mí, en este caso, desde el desconocimiento, el conseguir hablantes". "Bueno". "Que se presten a..." Que se presten a... Me falta ahí, ¿vale? Clico dos veces, otra vez, ahí, para entrar. Para volver a entrar en un comentario o en una anotación. Que se presten a... Vale. Y ahora creo que es la última intervención. "Bueno, curiosamente, sí". Bueno, curiosamente, sí, ¿no? Vale. Bueno, curiosamente, sí. Pues vamos aquí. Marcamos. Le decimos... Estoy en el hablante 2. Fijaos que está naranja el hablante 2. Si yo le digo añadir comentario, me lo va a añadir aquí. Esto era el hablante 1, quien decía esto. Vale. Línea... Perdón, comentario. Nuevo comentario aquí. ¿En qué decía esto? "Bueno, curiosamente, sí". Bueno, curiosamente, sí. Bueno, curiosamente, sí. ¿Vale? Bien. Y con esto... Bueno, voy a revisar que me queda más o menos bien. "Bueno, curiosamente, sí". El "bueno" aparece un poco después. Podemos dejar aquí un hueco. Otra vez con Alt, con Alt presionado. Voy aquí. Y ajusto ahí. "Bueno, curiosamente, sí". Y terminaríamos este audio. ¿Vale? Quedaría el audio, los fragmentos alineados con el tiempo.

O sea, yo, por ejemplo, luego el resultado de este ELAN, yo lo podría... imaginaos que hacemos un buscador que busca en los textos que tenemos aquí alineados. Bueno, pues si ese buscador permite buscar "intensidad", yo a partir del resultado, de este resultado, podría reproducir el fragmento en el que está. Pero no la palabra en concreto. Fijaos que intensidad, en esta manera de transcribir, no tiene marcas temporales. Por lo tanto, no sabemos con qué parte de la onda se corresponde. Entonces, lo que sí sabemos es que el enunciado que hemos marcado, el enunciado completo, sí que tiene marcas temporales. Entonces, a partir de un resultado del que forme parte... Insisto, estoy hablando de una posible aplicación de consulta de este fichero. Pues podríamos, a partir de un resultado que buscara aquí, podría obtener el enunciado completo en el que aparece y el audio completo en el que aparece, pero no sólo la palabra. No podríamos escuchar sólo la palabra donde se dice, porque no tenemos las marcas de audio. ¿Lo entendéis?

Bueno, simplemente era una cuestión básica y aquí, bueno, pues luego una vez hemos acabado, le podemos decir guardar como, y aquí le puedo decir, elan_audio_sample y se guarda en formato eaf. Normalmente nos crea dos ficheros, un pfsx y un eaf. El eaf es normalmente el más importante. Este es como un fichero de trabajo que a veces usa ELAN, pero el eaf es el que tiene toda la información. Después, pues haciendo doble clic en él o abriéndolo de nuevo, pues vemos que tenemos ahí guardado el alineamiento. ¿Vale? Bien, yo creo que con esto más o menos vimos lo básico. Importante, el mayúsculas, porque si no te vuelves loco, te vuelves loco con... Si no controlas el mayúsculas y el alt, no me puedo imaginar bien cómo trabajar con ELAN. Mayúsculas para ampliar la selección. ¿Veis que funciona por las dos partes? Yo puedo poner mayúsculas aquí y clicar. El mayúsculas es clicar. Y luego con el alt y arrastrar, ¿vale? Pues podemos modificar las anotaciones.

Luego aquí, pues eso, se puede entrar en temas de qué tipo de transcripción hacemos. ¿Transcribir a nivel de palabra o no hacerlo? ¿Cómo metemos las cabeceras de los hablantes? Ahora tenemos dos líneas, Hablante 1 y Hablante 2. ¿Dónde metemos o cómo hacemos con los metadatos de las cabeceras? ¿Qué más? Bueno, líneas, además de la transcripción, meter líneas de anotación de otro tipo. Hay muchas cosas en las que profundizar. Algunas las iremos desarrollando en vídeos posteriores, pero si queréis, si tenéis interés en alguna de estas cosas o si os ha gustado el vídeo y queréis que profundicemos más, podéis darle a me gusta o escribirnos en los comentarios qué parte concreta de todo esto queréis que desarrollemos con un poco más de profundidad.

Y nada más. Espero que este vídeo os haya sido de utilidad y nos vemos en la próxima entrega. ¡Hasta luego!

Utilizamos cookies para analizar el tráfico del sitio web y optimizar tu experiencia. Puedes aceptar o rechazar las cookies haciendo clic en los botones a continuación.

Política de cookies