Fonctionnalités
Transcriptions
- gestion de plusieurs niveaux de segmentation : la segmentation
élémentaire (généralement une segmentation
par phrase ou à chaque prise de souffle), la segmentation en tours
de parole (changement de locuteur) et la segmentation en grandes sections
(changement d'émission, de sujet...) ; à ces 3 niveaux imbriquées
de manière hiérarchique s'ajoute une 4ème segmentation
en condition acoustique (bruit de fond) indépendante
- affichage des segmentations sous le signal ainsi que dans la fenêtre
de texte ; l'affichage de la segmentation sous le signal peut être
désactivé ou réactivé par un menu contextuel
- édition de la transcription orthographique associée à
la segmentation élémentaire dans une fenêtre d'édition
de texte
- synchronisation permanente entre la position du curseur dans le texte
et du curseur dans le signal : quand le curseur change de segment
dans une fenêtre (texte ou signal), le curseur de l'autre fenêtre
est déplacé automatiquement pour apparaître dans le
même segment
- création aisée d'une segmentation élémentaire
du signal par insertions successives de frontières à la position
courante du curseur, et ce sans interrompre la lecture du son
- déplacement des frontières des segments avec la souris
- insertion de marqueurs de changement de conditions acoustiques (musique,
conversations, autres bruits) à la position du curseur dans
le signal
- désignation de frontières comme début de nouveau
tour de parole ou comme traitant d'un nouveau sujet
- édition des tours de parole, des changements de section ou des
conditions acoustiques par clic de souris sur le bouton correspondant dans
l'éditeur, avec possibilité de destruction
- gestion d'une liste des locuteurs avec la description précise
de chacun (nom, genre, accent...), modification ultérieure de ses
caractéristiques, recherche des prises de parole d'un locuteur dans
la transcription, importation sélective des locuteurs d'une autre
transcription
- de même, gestion d'une liste des sujets, recherche des sections
portant sur un sujet, importation sélective de sujets à partir
d'un autre fichier
- gestion spécifique de la parole superposée avec la présence
dans le texte de marqueurs pour les tours de parole des deux locuteurs
- insertion d'événements prédéfinis (bruits,
marqueurs de prononciation, marqueurs lexicaux, changement de langue ou
commentaires), qui peuvent être instantanés ou désigner
le début ou la fin de l'événement ; affichage dans
un format spécifique (police, couleur, balises de début et
fin) modifiable par l'utilisateur; édition ou destruction en cliquant
sur le texte
- fonctionnalités standard d'édition du texte de la transcription
: couper/copier/coller, annuler (très limité), chercher/remplacer...
- correction orthographique utilisant le logiciel 'ispell'
- glossaire de mots ou d'expressions prédéfinies
- fichiers au format XML pour une exploitation automatisée et
des échanges simplifiés ; validation des fichiers lus d'après
la syntaxe normalisée (DTD)
- choix du format d'encodage pour l'enregistrement et la relecture des
transcriptions ; les formats standards (ISO-8859-*, EUC-JP...) et
Unicode (UTF-8) sont disponibles.
- à l'ouverture d'un fichier de transcription, recherche automatique
du signal correspondant par diverses heuristiques; s'il n'est pas trouvé,
une fenêtre de dialogue permet de le désigner (et éventuellement
de n'utiliser aucun signal).
- importation automatique des fichiers .typ et de divers formats de segmentations
(xwaves, OGI...); exportation en .typ et .stm
- enregistrement automatique à intervalle régulier et récupération
en cas de plantage
- conservation de la version précédente dans un fichier
de secours
Manipulation des signaux
- lecture des formats audio les plus standards (via la librairie Snack)
- gestion de signaux audio de longue durée (jusqu'à plusieurs
heures);
pour les signaux de plus de 30 secondes, une image à faible résolution
du signal est pré-calculée en tâche de fond et stockée
afin d'accélerer les affichages ultérieurs
- accès direct à n'importe quelle position du signal ;
sélection d'une portion du signal
- curseur défilant lors de la restitution audio
- plusieurs modes de lecture accessibles par combinaison de touches : lecture/pause
simple, lecture de la totalité du segment courant, de la sélection,
ou encore d'un intervalle avant et après le curseur
- changement interactif de l'échelle d'affichage sans interruption
du son
- possibilité d'afficher deux vues du signal à des échelles
différentes
- zoom vertical
Autres fonctions
- affichage en secondes de la position du curseur durant la restitution,
des bornes de la sélection, et de divers messages sous le signal
- enregistrement possible de la quantité de travail effectuée
par le transcripteur à chaque session pour un suivi de la productivité
(à activer dans les options)
- fenêtre d'information sur le signal (nom, durée, format),
sur l'état de la transcription à l'instant considéré
(nombre de segments des différents niveaux de segmentation, nombre
de mots...) et éventuellement le travail produit dans la session
(si le suivi est activé)
- édition de la liste des événements prédéfinis
(bruits, prononciation...)
- édition des raccourcis claviers (pouvant inclure des balises
d'événements)
- choix des polices de caractères et des couleurs utilisées
par l'interface
- interface internationalisable par l'utilisateur dans toutes les langues
(anglais et français en standard)
- possible sauvegarde des noms des fichiers ouverts, des options et de
la position des fenêtres pour la session suivante dans un fichier
de configuration