Categorie
A proposito di Nuix

Perché non utilizzare l’ OCR per l’audio?

Perché non utilizzare l’ OCR per l’audio?

Che cosa? Aspetta. Cosa vuoi dire, “OCR per l’audio?” è uno scherzo ?

Quello di cui parliamo  è prendere il normale flusso di lavoro di invio di file immagine per il riconoscimento ottico dei caratteri (OCR) per trasformarli in testo leggibile dalla macchina, e di utilizzarlo per i file audio. Perché elaborare i file audio con  flussi di lavoro specifici condotto con attrezzature speciali quando li si può trattare come qualsiasi altra eccezione?

Perché la voce è un problema

Per anni, i clienti ci hanno esposto  quanto odiano avere a che fare con registrazioni vocali. A differenza di quasi ogni altra forma di contenuti digitali, il discorso richiede un processo manuale di ascolto e trascrizione. Questo richiede tempo e denaro.

Questo è il motivo per cui abbiamo collaborato con compagnie voce speech-to-text  per creare Nuix Voice. Ora si può facilmente esportare  tutti i file  l’audio (e video) su un server Nuix voice , che converte la traccia audio in una  trascrizione totale con punteggiatura , completa di identificazione del tono e del sesso dell’interlocutore .  La trascrizione risultante torna in  Nuix come testo che può essere oggetto di ricerca e analisi di metadati.

Suona familiare? Ecco perché il flusso di lavoro è esattamente lo stesso di chi ha lavorato  per anni con OCR. Ci si potrebbe chiedere perché insistere su OCR … mi piace l’analogia OCR per due motivi.

Flusso di lavoro familiare

Il flusso di lavoro OCR è noto a quasi tutti coloro che utilizzano Nuix. Identificare tutti gli elementi candidati, eseguirli attraverso un processo che converte il testo basato su immagini in testo ricercabile, e inserirlo nuovamente nel flusso di lavoro standard.  Nuix Voice rende altrettanto facile il processo  per l’audio.

La precisione dipende dalla qualità della sorgente

Nessuno si aspetta che l’OCR sia perfetto . Il software sta cercando di interpretare i punti su una pagina e li converte in parole. Certo, un essere umano potrebbe probabilmente fare un lavoro migliore, perché i nostri cervelli posso indovinare e riconoscere modelli molto meglio di un computer. Ma quando è stata l’ultima volta che hai pagato qualcuno per trascrivere manualmente tutti i candidati OCR?

L’audio è simile. Il computer cerca di  “ascoltare” i suoni, trasformarli in parole, e metterli in frasi. Il risultato non è perfetto, soprattutto se il file di origine è di scarsa qualità, ma è fino a 200 volte più veloce rispetto ad  una persona che ascolta e trascrive l’audio. E ‘un modo molto più efficiente che catalogare  enormi volumi di audio.

Più testo per Analisi più potenti

Nuix Voice consente di estrarre il testo dai file audio e video e di indagare ed analizzare quei contenuti come gli altri . Chiudete gli occhi e immaginate di essere in grado di interagire con tutti i canali di comunicazione-mail, SMS, Skype, chat, audio ,voicemail-  con i normali strumenti , termini di ricerca concordati , e flussi di lavoro standard.

Ora aprite gli occhi e date un’occhiata a Nuix Voice perché quel sogno è la realtà.

Con Nuix Voice, è possibile gestire come qualsiasi altra comunicazione discorso registrato.
Con Nuix Voice, è possibile gestire come qualsiasi altra comunicazione discorso registrato.

Per maggiori informazioni su Nuix, clicca qui.