Perché non utilizzare l’ OCR per l’audio?
Che cosa? Aspetta. Cosa vuoi dire, “OCR per l’audio?” è uno scherzo ?
Quello di cui parliamo è prendere il normale flusso di lavoro di invio di file immagine per il riconoscimento ottico dei caratteri (OCR) per trasformarli in testo leggibile dalla macchina, e di utilizzarlo per i file audio. Perché elaborare i file audio con flussi di lavoro specifici condotto con attrezzature speciali quando li si può trattare come qualsiasi altra eccezione?
Perché la voce è un problema
Per anni, i clienti ci hanno esposto quanto odiano avere a che fare con registrazioni vocali. A differenza di quasi ogni altra forma di contenuti digitali, il discorso richiede un processo manuale di ascolto e trascrizione. Questo richiede tempo e denaro.
Questo è il motivo per cui abbiamo collaborato con compagnie voce speech-to-text per creare Nuix Voice. Ora si può facilmente esportare tutti i file l’audio (e video) su un server Nuix voice , che converte la traccia audio in una trascrizione totale con punteggiatura , completa di identificazione del tono e del sesso dell’interlocutore . La trascrizione risultante torna in Nuix come testo che può essere oggetto di ricerca e analisi di metadati.
Suona familiare? Ecco perché il flusso di lavoro è esattamente lo stesso di chi ha lavorato per anni con OCR. Ci si potrebbe chiedere perché insistere su OCR … mi piace l’analogia OCR per due motivi.
Flusso di lavoro familiare
Il flusso di lavoro OCR è noto a quasi tutti coloro che utilizzano Nuix. Identificare tutti gli elementi candidati, eseguirli attraverso un processo che converte il testo basato su immagini in testo ricercabile, e inserirlo nuovamente nel flusso di lavoro standard. Nuix Voice rende altrettanto facile il processo per l’audio.
La precisione dipende dalla qualità della sorgente
Nessuno si aspetta che l’OCR sia perfetto . Il software sta cercando di interpretare i punti su una pagina e li converte in parole. Certo, un essere umano potrebbe probabilmente fare un lavoro migliore, perché i nostri cervelli posso indovinare e riconoscere modelli molto meglio di un computer. Ma quando è stata l’ultima volta che hai pagato qualcuno per trascrivere manualmente tutti i candidati OCR?
L’audio è simile. Il computer cerca di “ascoltare” i suoni, trasformarli in parole, e metterli in frasi. Il risultato non è perfetto, soprattutto se il file di origine è di scarsa qualità, ma è fino a 200 volte più veloce rispetto ad una persona che ascolta e trascrive l’audio. E ‘un modo molto più efficiente che catalogare enormi volumi di audio.
Più testo per Analisi più potenti
Nuix Voice consente di estrarre il testo dai file audio e video e di indagare ed analizzare quei contenuti come gli altri . Chiudete gli occhi e immaginate di essere in grado di interagire con tutti i canali di comunicazione-mail, SMS, Skype, chat, audio ,voicemail- con i normali strumenti , termini di ricerca concordati , e flussi di lavoro standard.
Ora aprite gli occhi e date un’occhiata a Nuix Voice perché quel sogno è la realtà.
Per maggiori informazioni su Nuix, clicca qui.