En muchas ocasiones encontramos que en nuestras investigaciones hay archivos de audio o vídeo que tienen que ser tratados de forma diferente al resto de archivos para poder conocer su contenido, por lo que sería muy útil poder establecer algún proceso en el que se pudiese trascribir el audio a texto.
Me refiero a que resulta necesario establecer un flujo de trabajo estándar donde se pueda hacer reconocimiento óptico de caracteres (OCR) de estos archivos, para así convertirlos en texto legible y que no sean tratados como una excepción.
¿Por qué los archivos de voz son un problema?
Durante años, los investigadores han mostrado su descontento al tener que analizar archivos con grabaciones de voz. A diferencia de casi todas las otras formas de contenidos digitales, la voz requiere un proceso manual de escucha y transcripción. Esto lleva tiempo y cuesta dinero.
Ante la inminente necesidad de los investigadores, Nuix se asoció con una compañía de tecnología de voz, para crear texto a partir de archivos de audio, y pone a disposición de los investigadores la nueva herramienta Nuix Voice. Con este producto, se podrá convertir pistas de audio en texto, la trasncripción resultante se indexará en Nuix y pudiéndose hacer búsquedas de texto sobre los archivos y conocer todos sus metadatos.
El flujo de trabajo para estos archivos es el mismo que se ha venido utilizado durante años con el OCR. Se procesa la evidencia, se identifican los archivos no legibles, se pasa el proceso de OCR y el contenido de los archivos es indexado en Nuix para poder hacer búsquedas de texto sobre el contenido de los mismos.
Flujo de trabajo conocido
El flujo de trabajo de OCR es familiar a casi todos los que usan Nuix. Identificar los elementos, seleccionarlos y ejecutar un proceso que convierte el texto basado en imágenes en texto de búsqueda. Nuix Voice hace que sea igual de fácil el proceso de transcripción de los archivos de audio.
La exactitud del texto depende de la calidad de la fuente
Es evidente que no se espera que el trabajo del OCR sea completamente exacto y preciso. Con el OCR, el software está tratando de interpretar las letras y puntos de una página para convertirlos en palabras. Sin duda alguna, si una persona hiciera este procedimiento haría un mejor trabajo, pues nuestros cerebros son mucho mejores para adivinar y reconocer patrones que los ordenadores. ¿Pero cuándo fue la última vez que durante una investigación se pagó a una persona para que transcribiese de forma manual todos los archivos que no tienen texto reconocible?
Con los archivos de audio, es similar. El programa trata de “escucha” los sonidos, transformarlos en palabras y ponerlos en frases. El resultado no es perfecto, en especial si el archivo original es de mala calidad, pero es hasta 200 veces más rápido que tener a una persona escuchando y transcribiendo el audio. Es una forma más eficaz de hacer investigaciones cuando se tienen grandes volúmenes de archivos de audio.
Más texto para hacer un análisis más completo
Nuix Voice permite extraer el texto de los archivos de audio y vídeo, para posteriormente hacer investigaciones como en cualquier otro tipo de comunicación. Haz el ejercicio de cerrar los ojos e imaginar que se puede interactuar con todos los canales de comunicación – emails, SMS, Skype, chats, notas de voz – con las herramientas de trabajo actuales, donde se pueden acotar términos de búsqueda, filtros por fecha o establecer un flujo de trabajo.
Con Nuix Voice lo que hemos imaginado es posible.
_____________________________
Para más información sobre los productos Nuix, haga clic AQUI.