E’ molto importante ricordare una regola fondamentale – spesso disattesa – nelle attività di acquisizione dei documenti (document capture) che passa sotto l’acronimo GIGO e cioè Garbage In – Garbage Out (spazzatura dentro – spazzatura fuori)

cattiva qualità in ingresso = cattiva qualità in uscita
Nelle attività di acquisizione dei documenti da scanner – ma considerando anche quelle dove il documento si trova già in formato digitale perché in precedenza acquisito da scanner o proveniente per esempio da canali fax – spesso ci si imbatte in una scarsa automazione dei processi legati al documento perché i dati in essi contenuti non sono leggibili. La conseguenza è spesso una cattiva percezione delle tecnologia di automazione che, basandosi sui dati estratti, non velocizza il processo nel suo contesto generale ed obbliga molti operatori all’inserimento dei dati a mano con conseguente aumento del costo a pagina.
Anche le tecnologie di pulizia delle immagini (clean up) e/o di equalizzazione a volte non funzionano perché dipendono spesso dalla qualità del documento originale in fase di acquisizione.
Un giusto approccio ed attenzione alla modalità di acquisizione come:
- REGOLARE LA RISOLUZIONE DELLO SCANNER A 300DPI – NE SOTTO NE SOPRA –
- UTILIZZARE UN BUON SOFTWARE DI PULIZIA IMMAGINI – NON TROPPO AGGRESSIVO –
- PULIRE REGOLARMENTE LE LAMPADE/LED DELLO SCANNER DI ACQUISIZIONE
ci permetterà di ottenere delle buone immagini e quindi dei buoni dati estratti che verranno utilizzati per esempio per classificare automaticamente – auto clustering – i documenti – separazione automatica – all’interno di una pratica complessa ed evitare il maggior numero di interazioni di un operatore per correggere i dati prima di inviarli ai sistemi di business.
Anche utilizzando sistemi di trasmissione FAX oppure MFP (Multifunzione) assicurarsi prima, con un piccolo test (benchmark), che questi sistemi producono immagini buone altrimenti è opportuno suggerire dei dispositivi alternativi per evitare che l’intero progetto di automazione fallisca.
Infatti spesse volte anche le macchine MFP – per risparmiare toner – producono immagini non perfettamente contrastate e in molti casi asimmetriche che mettono, poi, in crisi sistemi di riconoscimento OCR e tutta la catena tecnologica a valle.
Suggerire, alle persone operative che hanno toccato i documenti prima dell’acquisizione, la corretta attività sulle pagine evitando per esempio segni di spunta in quanto qualsiasi segno non conforme al documento crea “rumore di fondo” mettendo in “difficoltà” i vari motori di riconoscimento utilizzati per l’estrazione dei dati in modalità automatica.
Anche sulle tabelle – per esempio di una fattura passiva – assicurarsi che le colonne siano pulite e prive di eventuali post-it.
E’ importante utilizzare delle piccole regole di buon senso dalla preparazione >>>> alla conservazione del documento prima della scansione perché non esiste una tecnologia “magica” che può fare miracoli per cui se nel nostro sistema di cattura documenti entra “spazzatura” ci possiamo aspettare in uscita solo “spazzatura” (GIGO).