Prévia do material em texto
4 CONSIGLI E TECNICHE I primi tre capitoli del presente manuale per l’utente contengono informazioni che permettono di comprendere, installare e usare le funzioni principali di TextBridge. Il presente capitolo descrive i metodi di ottimizzazione dei risultati dell’OCR. In particolare, questo capitolo tratta gli argomenti seguenti: • Per il migliore riconoscimento del testo • Consigli per una elaborazione efficiente • Memorizzazione delle immagini di pagina • Esecuzione di TextBridge OCR da altre applicazioni PER IL MIGLIORE RICONOSCIMENTO DEL TESTO Il software TextBridge OCR raggiunge un livello molto alto di accuratezza nel riconoscimento dei caratteri su una vasta gamma di documenti. Tuttavia, è possibile ottenere da TextBridge il migliore riconoscimento dei caratteri per documenti particolari. Questa sezione offre suggerimenti per l’ottimizzazione del riconoscimento dei testi, e in particolare tratta gli argomenti seguenti: • Uso e manutenzione corretti dello scanner • Regolazione della luminosità dello scanner • In caso di colori • Uso del filtro del fax • Elaborazione separata di più documenti • Uso del verificatore delle parole • Uso del comando Inverti in Anteprima Manuale per l'utente di TextBridge 4–1 Uso e manutenzione corretti dello scanner L’uso e la manutenzione dello scanner possono determinare la riuscita o il fallimento della scansione. Leggere i consigli riportati di seguito: • Conoscere lo scanner. Leggere e comprendere tutta la documentazione fornita con lo scanner. • Pulire lo scanner. Tenere lo scanner pulito e togliere la polvere. Tenere pulito anche il letto piano di vetro dello scanner, e togliere gli eventuali residui catturati durante la scansione. • Caricare correttamente lo scanner. Assicurarsi che il documento non venga digitalizzato ad angolo, per non complicare il riconoscimento dei caratteri. Quando si usa l’alimentatore dei documenti, assi- curarsi che le guide siano allineate correttamente per le pagine sottoposte a scansione (Figura 4–1). Se si utilizza il letto piano, assicurarsi che l’immagine di pagina sia rivolta verso il vetro e sia diritta. A volte l’immagine è storta rispetto alla carta su cui viene stampata. Prima della scan- sione, se possibile correggere questo problema. Regolare le guide a seconda del documento, per ridurre al minimo la deviazione della pagina Figura 4–1. Collocazione della pagina nello scanner 4–2 Manuale per l'utente di TextBridge Regolazione della luminosità dello scanner Durante la scansione, una delle impostazioni più importanti da cui dipende la riuscita del riconosci- mento dei caratteri, è la luminosità dello scanner. Come illustra la Figura 4–2, i documenti originali sottoposti a scansione possono essere molto diversi. L’accuratezza del riconoscimento dei caratteri può dipendere dall’oscurità del testo, dalla luminosità di sfondo e dalla quantità di elementi estranei (sporco, sbavature di inchiostro, impronte, scrittura a mano e altri segni). Caratteri con sbavature; aumentare la luminosità Caratteri chiari e sottili; ridurre la luminosità Caratteri su sfondo scuro; aumentare la luminosità Figura 4–2. Copie originali e luminosità dei documenti Dalla finestra di dialogo Impostazioni scanner (Figura 4–3), è possibile regolare la Luminosità in modo da compensare la qualità di stampa e lo sfondo dei documenti. È possibile accedere alle Impostazioni scanner dalla finestra di dialogo Preferenze. Consigli e tecniche 4–3 Provare la luminosità Più chiara se i caratteri sulla pagina sono troppo scuri, se sono troppo pieni o se sono a contatto tra di loro, o se le parole sono separate da spazi molto ristretti (come in alcune riviste). Il riconoscimento di documenti con elementi estranei sullo sfondo o con sfondi filtrati o colorati può migliorare notevolmente se si aumenta il livello di luminosità. Impostare la luminosità per ottimizzare l’OCR Figura 4–3. Impostazioni della luminosità dello scanner Provare la luminosità Più scura se i caratteri sulla pagina appaiono leggeri, frammentati o molto sottili. Se lo scanner supporta l’impostazione Auto(matica) della luminosità, selezionarla per ottenere il livello migliore di luminosità per ogni pagina del documento. Un altro modo per capire se la luminosità è adeguata, consiste nell’eseguire l’anteprima della pagina e ingrandirla fino alla risoluzione massima nella finestra di Anteprima. In tal modo, si può controllare la produzione dello scanner che il sistema “vede” (Figura 4–4). Se la luminosità dell’immagine in anteprima non sembra adeguata, regolarne l’impostazione e ripetere la scansione del documento. 4–4 Manuale per l'utente di TextBridge La pagina è scura; aumentare la luminosità e scandire di nuovo Figura 4–4. Ingrandimento dell’immagine in anteprima In caso di colori Tutti gli scanner non leggono uno o più colori, denominati colori ignorati. Consultare la documentazione dello scanner per determinarne il colore ignorato. ☞ Se la documentazione dello scanner non fa riferimento al colore ignorato, esaminare il colore della luce dello scanner mentre si muove lungo il letto piano. Il colore della luce determina il colore ignorato. Ad esempio, molti scanner sono dotati di una luce verde chiaro; in tal caso, il colore ignorato sarà appunto il verde chiaro. Oltre ai colori ignorati, altri colori possono essere letti con difficoltà dallo scanner. Se il testo o l’immagine digitalizzata è colorata o stampata su uno sfondo a colori, si può provare a regolare l’impostazione della luminosità. Se non si ottengono risultati positivi, provare a foto- copiare la pagina e a digitalizzare la copia in bianco e nero. Consigli e tecniche 4–5 Uso del filtro del fax TextBridge può essere utilizzato per riconoscere il testo contenuto in immagini di fax che, di solito, presentano risoluzioni basse (100 per 200, 200 per 100, o 200 per 200 punti per pollice). Anche i fax con “risoluzione fine” a 200 per 200 dpi spesso sono leggibili solo in parte (Figura 4–5). Le immagini di fax sono a bassa risoluzione e spesso sono oblique Figura 4–5. Immagine di fax Per riconoscere le immagini di fax, TextBridge è dotato dell’impostazione Fax nella finestra di dialogo Preferenze. Questo filtro di Qualità del documento avvia un’operazione di pre-elaborazione che migliora le immagini di fax prima che inizi l’OCR. Il comando Fax viene applicato alle immagini di fax contenute in file TIFF e ai fax stampati e digitalizzati a risoluzioni superiori (ad esempio, 300 dpi). Nota Non utilizzare il filtro Fax su documenti che non sono fax, siano essi digitalizzati o in linea, per evitare che l’accuratezza dell’OCR sia degradata. Inoltre, se si nota che il riconoscimento non dà buoni risultati sulle immagini di fax sintetizzate (ad esempio, un docu- mento prodotto da un elaboratore testi e “stampato” su un fax modem), disattivare l’opzione Fax e provare a verificare una parte del testo durante l’OCR. 4–6 Manuale per l'utente di TextBridge Elaborazione separata di più documenti Il software TextBridge OCR utilizza varie tecniche di intelligenza artificiale per riconoscere il testo. Tramite tali tecniche, TextBridge “apprende” cosa sta riconoscendo. In tal modo, TextBridge può migliorare l’accuratezza e la velocità dell’OCR durante la scansione e il riconoscimento di pagine successive di un documento. Tuttavia, questa capacità di apprendimento può essere compromessa dall’elaborazione di pagine di documenti diversi sullo stesso file di uscita. TextBridge prevede che la seconda pagina e le pagine successive di un documento utilizzino gli stessi font (tipi di carattere) riconosciuti sulla prima pagina (Figura 4–6). Consigli e tecniche 4–7 Elaborare queste pagine come documento unico Elaborare queste pagine come tre documenti separati Figura 4–6. Elaborazione di più documenti Se la seconda pagina è completamente diversa, con tipi di carattere e dimensioni di punti diversi, la conoscenza acquisita da TextBridge nella primapagina non è più valida. TextBridge deve ricominciare dunque l’operazione di apprendimento per la seconda pagina e per quelle successive. Per digitalizzare più documenti e ottenere i migliori risultati di scansione, occorre digitalizzare ogni documento in sessioni di lavoro separate. 4–8 Manuale per l'utente di TextBridge Uso del verificatore delle parole Se i risultati di TextBridge sono molto insoddisfacenti riguardo a un documento particolare, usare il verificatore delle parole per migliorare l’accuratezza di riconoscimento. Interagendo con l’operazione di riconoscimento OCR nella finestra del Verificatore (Figura 4–7), a TextBridge vengono “insegnati” i caratteri e le parole del documento, migliorando notevolmente l’accuratezza di riconoscimento. Verificare il testo per migliorare l’accuratezza Figura 4–7. Finestra del Verificatore Ogni parola che TextBridge non riesce a riconoscere o di cui è insicuro, appare nella casella di modifica Parola, nella parte superiore della finestra del Verificatore. L’immagine della parola appare evidenziata sotto, nel contesto. Con il Verificatore, è possibile spostarsi nel testo riconosciuto e accettare o correggere le decisioni di riconoscimento di TextBridge. L’immissione da parte dell’utente aiuta TextBridge a migliorare il riconoscimento durante il corso dell’operazione. Consigli e tecniche 4–9 In genere, nei documenti a più pagine, verificare una o due pagine, poi interrompere la verifica. TextBridge userà l’immissione da parte dell’utente per migliorare le decisioni di riconoscimento per il resto del documento. In caso di documenti di piccole dimensioni (a una o due pagine), per ottenere la migliore accuratezza di riconoscimento si può verificare l’intero documento. Per ulteriori informazioni sull’uso del verificatore delle parole e sulle relative opzioni, consultare il Capitolo 3. Uso del comando Inverti in Anteprima TextBridge può riconoscere i file TIFF in linea generati da fax modem o altre sorgenti. A volte, i dati di immagini vengono salvati in modo che gli elementi d’immagine (pixel) nei file di uscita siano in negativo: lo sfondo di pagina bianco diventa nero e la stampa sulla pagina è bianca. Questo accade spesso, ad esempio, nel caso di file Intel FAXability. TextBridge non è in grado di riconoscere tali file. Per il riconoscimento di file TIFF in linea, è essenziale che l’immagine contenga caratteri neri su sfondo bianco. 4–10 Manuale per l'utente di TextBridge Per abilitare il riconoscimento di file con immagini in negativo, TextBridge dispone del comando Inverti, nel menu Visualizza della finestra di Anteprima (Figura 4–8). Prima dell’OCR, invertire le imma- gini in negativo Figura 4–8. Inversione di un documento Se non si è sicuri che un file in linea sia in negativo, visualizzarlo nella finestra di Anteprima prima di avviare l’OCR. Se appare con caratteri bianchi su sfondo nero, fare scendere il menu Visualizza e fare clic sul comando Inverti. TextBridge invertirà l’immagine. A questo punto si può avviare il riconoscimento OCR. Tenere presente che l’inversione deve essere eseguita a mano per ogni file TIFF memorizzato in tal modo. Per l’uso di Anteprima, consultare il Capitolo 3. Consigli e tecniche 4–11 CONSIGLI PER UNA ELABORAZIONE EFFICIENTE Quando si utilizza TextBridge per la prima volta, può risultare più facile digitalizzare un documento senza regolare le preferenze predefinite. In molti casi, usando tali impostazioni si ottengono buoni risultati. Tuttavia, per ottenere le migliori prestazioni da TextBridge, prima di avviare l’OCR si può fare quanto segue: • usare lo strumento di creazione zone in Anteprima • usare l’impostazione Ignora foto/mezzi toni • usare l’orientamento automatico, se risulta adeguato • usare la segmentazione automatica per documenti a più colonne Queste caratteristiche servono ad assicurare che il sistema elabori solo le parti più importanti di una pagina, e che le elabori correttamente. In un documento intero o in molti documenti, l’uso di queste caratteristiche può tradursi in notevoli risparmi di tempo. Definizione di zona per catturare solo i dati desiderati Alcuni documenti possono contenere loghi, grafica, intestazioni e piè di pagina correnti e altri elementi che non hanno bisogno di essere acquisiti e che potrebbero rallentare l’operazione di riconoscimento. Con lo strumento di creazione zone nella finestra di Anteprima, si può identificare solo la porzione della pagina o delle pagine da acquisire (Figura 4–9). Per informazioni sull’uso degli strumenti di anteprima, consultare il Capitolo 3. 4–12 Manuale per l'utente di TextBridge Delimitare la zona per elaborare solo una parte del testo Figura 4–9. Zona in Anteprima Uso dell’opzione Ignora foto/mezzi toni Su un documento stampato, la fotografia a mezzi toni è formata di punti neri di varie dimensioni. Di solito, TextBridge impiega del tempo per riconoscere i punti di mezzo tono come testo. Al termine, TextBridge giunge alla conclusione che stava riconoscendo un mezzo tono e a quel punto lo ignora. Tuttavia, per accelerare il riconoscimento del testo su documenti contenenti mezzi toni, si può attivare l’impostazione Ignora foto/mezzi toni prima di eseguire l’OCR. Consigli e tecniche 4–13 Una volta attivata l’opzione Ignora foto/mezzi toni, TextBridge digitalizza velocemente l’immagine di pagina e maschera i mezzi toni prima di avviare il riconoscimento dei caratteri (Figura 4–10). In tal modo, il riconoscimento effettivo dei caratteri è più veloce ed efficiente. TextBridge tenta di eseguire l’OCR dei mezzi toni come testo Con il filtro, i mezzi toni vengono rimossi prima che inizi l’OCR Figura 4–10. Il filtro Ignora foto/mezzi toni Per usare l’opzione Ignora foto/mezzi toni, selezionare il pulsante Preferenze dalla finestra principale. Nella finestra di dialogo Preferenze, fare clic e attivare la casella di controllo Ignora foto/mezzi toni. ☞ Anche se l’operazione di attivazione del filtro Ignora foto/mezzi toni è relativamente veloce, non specificarla se il documento non contiene mezzi toni. 4–14 Manuale per l'utente di TextBridge Uso dell’orientamento automatico di pagina TextBridge è fornito di uno strumento che determina automaticamente l’orientamento di una pagina, la ruota in memoria se necessario, poi avvia l’OCR (Figura 4–11). Specificare Orientamento automatico di pagina nella finestra di dialogo Preferenze, accessibile dalla finestra di dialogo principale. Questa opzione è utile in alcuni casi, ad esempio: Orientamento verticale (lato in su o capovolto) Orientamento orizzontale (pagina ruotata più o meno di 90 gradi) o o Figura 4–11. Esecuzione dell’orientamento automatico di pagina • quando si elaborano documenti con pagine a orientamento misto • quando si elabora un file TIFF e non si conosce l’orientamento dell’immagine in esso contenuta Nel primo caso, si potrebbe trattare dell’elaborazione di un documento in cui la maggior parte delle pagine sia ad orientamento verticale, con alcune pagine ad orientamento orizzontale. Consigli e tecniche 4–15 TextBridge digitalizza ogni pagina, determina se è ad orientamento verticale, orizzontale (a 90 o 270 gradi), o capovolta, e la ruota fino all’orientamento verticale (0 gradi) prima di avviare l’OCR. Nel secondo caso, se l’immagine TIFF da riconoscere è di traverso o capovolta, Text-Bridge la ruota adeguatamente, poi la sottopone a riconoscimento. ☞ L’orientamento automatico è una fase di elaborazione anteriore al riconoscimento; per questo, per ottenere l’OCR più rapido, conviene usare l’orientamento automatico solo quando le circostanze lo richiedono. Uso della segmentazione automatica di pagina TextBridge è provvisto di uno strumento che individua automaticamente regioni di testo sulla pagina, ne definisce l’ordine, poi procede all’OCR. Questa caratteristica di segmentazione automatica di pagina è molto utile per il riconoscimento di pagine a più colonne e/o a schemi inconsueti (Figura4–12). Poi identifica e ordina le regioni La segmen- tazione automatica analizza lo schema della pagina Figura 4–12. Segmentazione di pagina e ordinamento delle regioni 4–16 Manuale per l'utente di TextBridge Importante La segmentazione automatica deve essere attivata se si stanno elaborando pagine con più di una colonna di testo, altrimenti TextBridge può emettere in ordine errato le regioni di testo riconosciuto. Non usare la segmentazione automatica su documenti ad una sola colonna. La segmentazione automatica è una fase di pre- elaborazione anteriore all’inizio dell’OCR. Tenere presente che si può creare una zona in Anteprima e usare anche la segmentazione automatica, che sarà applicata solo alla zona in questione. Ad esempio, se si delimita una zona attorno a due colonne di uno schema a tre colonne, la segmentazione automatica individua e ordina le due colonne in preparazione dell’operazione OCR. MEMORIZZAZIONE DELLE IMMAGINI DI PAGINA Una delle opzioni delle caselle di controllo nella finestra di dialogo principale è Salva immagini di pagina. Questa opzione, disponibile quando si seleziona Scanner sotto Entrata da, permette di salvare un’immagine binaria (in bianco e nero) di ogni pagina durante una sessione di TextBridge OCR. Nota TextBridge salva le immagini di pagina come file TIFF con compressione CCITT Gruppo 3. Gruppo 3 è uno standard di compressione specificato dal CCITT (Consultative Committee of International Telephone and Telegraph), un’organizzazione internazionale per gli standard. Consigli e tecniche 4–17 Dopo aver fatto clic su VIA e dopo la scansione della prima pagina, TextBridge visualizza la finestra di dialogo Salva immagine di pagina con nome (Figura 4–13). Digitare qui il nome di base per le immagini di pagina Figura 4–13. Finestra di dialogo Salva immagine di pagina con nome La finestra di dialogo Salva immagine di pagina con nome è molto simile alla finestra di dialogo standard Windows Salva con nome, in quanto permette di specificare un nome per il file, il tipo di file, la directory e l'unità disco di uscita. Il nome del file rappresenta il nome di base su cui i nomi dei file di immagini di pagina vengono costituiti. Inoltre, rappresenta il nome del documento che appare sempre nella finestra di dialogo Salva con nome di TextBridge, quando l’OCR è stato completato. Il nome di file predefinito è notitulo, con estensione .tif. Ad esempio, se si specificasse il nome “manuale” nella finestra di dialogo Salva immagine di pagina con nome, i file di immagini di pagina verrebbero memorizzati con un nome in formato: manunnnn.TIF dove nnnn è il numero di pagina del documento preceduto da zeri (ad esempio, 0001, 0002 e così via). 4–18 Manuale per l'utente di TextBridge I file di immagini di pagina vengono nominati in sequenza all’interno della directory. Se un file dello stesso nome (ad esempio, “manu0001.tif”) già esiste, TextBridge inizierà dal numero successivo nella sequenza. Inoltre, al termine del lavoro, il nome del documento (ad esempio, “manuale”) appare automaticamente nella casella Nome file, nella finestra di dialogo standard Salva con nome. Nella finestra Salva immagine di pagina con nome, la directory di lavoro iniziale è la directory dalla quale viene lanciato TextBridge: C:\TXBRIDGE\BIN Tuttavia, si può specificare qualsiasi altra unità disco e directory in cui memorizzare le immagini di pagina, che diventerà la nuova directory di lavoro per il lavoro in questione e, come il nome del documento, comparirà nella finestra di dialogo Salva con nome al termine dell’OCR. Per informazioni sul formato dei file con immagini di pagina, il menu Salva il file con formato permette solo di selezionare TIFF CCITT-3 Intel. Le immagini di pagina vengono salvate esattamente come se fossero digitalizzate in formato binario (bianco e nero). Tenere presente che facendo clic su Annulla nella finestra di dialogo Salva immagine di pagina con nome, la finestra si chiude e TextBridge termina il lavoro. La finestra di dialogo principale rimane aperta per ricominciare l’operazione. Ad esempio, se si decide di non salvare le immagini di pagina, si può disattivare con un clic la casella di controllo Salva immagine di pagina e ricominciare il lavoro. Consigli e tecniche 4–19 ESECUZIONE DI TEXTBRIDGE OCR DA ALTRE APPLICAZIONI TextBridge OCR per Windows in realtà è una serie di applicazioni che permettono di eseguire l’OCR dall’interno praticamente di tutte le altre applicazioni Windows. Oltre all’utilità principale, che viene eseguita come programma a sé stante ed è dotata del set di funzioni più ampio, TextBridge OCR è fornito in altre due forme: • Server di applicazioni TextBridge, un programma che agisce come elemento di menu dall’interno praticamente di tutte le altre applicazioni di testo registrate Windows (elaboratore testi, software per l’editoria, foglio elettronico, applicazione di database, ecc.). • Stampante TextBridge OCR (TextBridge OCR Printer), una funzione che consente di inviare un’immagine in qualsiasi formato ad una versione di TextBridge OCR che agisca come un normale driver di stampante. La presente sezione fornisce informazioni sull’uso di TextBridge OCR in queste forme. Nota TextBridge supporta anche un’interfaccia DDE. Per i dettagli in proposito, gli sviluppatori di software e gli integratori di sistemi interessati possono contattare il servizio di Assistenza clienti della Xerox Imaging Systems. Uso del Server di applicazioni TextBridge Il server di applicazioni TextBridge è un programma Windows che può essere “collegato” ad altre applicazioni di testo Windows, in modo da essere eseguito dal loro interno. 4–20 Manuale per l'utente di TextBridge Una volta collegato, il server di applicazioni appare nel menu File dell’applicazione ospite, sotto forma del comando TextBridge OCR. Quando si seleziona TextBridge OCR, appare la finestra di dialogo principale di TextBridge, come se fosse una finestra dell’applicazione ospite. Da essa, si può impostare e avviare l’OCR esattamente come avviene per il programma standard TextBridge. Avvio del Server di applicazioni TextBridge e registrazione delle applicazioni Il server di applicazioni TextBridge viene installato durante l’operazione di TextBridge descritta al Capitolo 2 del presente manuale. Al termine dell’installazione, il programma di TextBridge setup crea un gruppo di programmi TextBridge OCR che include il programma Server di applicazioni TextBridge (Figura 4–14). Fare doppio clic per avviare il programma Figura 4–14. Il programma Server di applicazioni TextBridge Prima di eseguire il Server di applicazioni TextBridge dall’interno di un’applicazione, occorre avviare il programma, ed eventualmente registrare anche l’applicazione: Consigli e tecniche 4–21 1. Fare doppio clic sull’icona del programma Server di applicazioni TextBridge, nel gruppo di programmi TextBridge OCR. Il programma viene avviato e appare ridotto a icona sul desktop di Windows. 2. Fare doppio clic sopra l’icona, sul desktop di Windows. Apparirà la finestra di registrazione del server di applicazioni (Figura 4–15). Selezionare l’applicazione non registrata Poi fare clic su Aggiungi Figura 4–15. Finestra di registrazione del Server di applicazioni TextBridge 3. Se necessario, registrare l’applicazione. • Nella parte superiore della finestra di registrazione, evidenziare l’applicazione da registrare. • Fare clic sul pulsante Aggiungi per aggiungere questa applicazione all’elenco delle Applicazio- ni registrate che appare in fondo alla finestra. • Al termine della registrazione della/e applicazione/i, fare clic su OK. A questo punto si può utilizzare TextBridge OCR dall’interno dell’applicazione registrata. 4–22 Manuale per l'utente di TextBridge Esecuzione del Server di applicazioni TextBridge dall’interno dell’applicazione Nel menu File di qualsiasi applicazione attiva registrata, il comando TextBridge OCR è l’ultimo della lista, e precede solo il comando Esci. NotaPerché il server di applicazioni funzioni, l’applicazione ospite deve presentare un menu File e, in questo menu, il comando Esci. Questo standard è utilizzato dalla maggior parte delle applicazioni Windows. Come esempio, la Figura 4–16 mostra il comando TextBridge OCR nel menu File di MS Write®. Fare clic qui per visualizzare la finestra di dialogo principale Figura 4–16. Il comando TextBridge OCR Per eseguire il server di applicazioni e importare il testo riconosciuto direttamente nel documento aperto dell’applicazione ospite, fare quanto segue. Consigli e tecniche 4–23 1. Avviare il server di applicazioni TextBridge. Fare doppio clic sull’icona del programma nel gruppo di programmi TextBridge OCR (vedere la Figura 4–14). ☞ Per fare sì che il server di applicazioni si avvii automaticamente quando viene lanciato Windows, collocarlo nel gruppo di programmi di Avvio. 2. Assicurarsi che l’applicazione ospite sia registrata. Consultare il procedimento riportato nella sezione precedente, “Avvio del Server di applicazioni TextBridge e registrazione delle applicazioni”. 3. Avviare l’applicazione ospite. Con l’applicazione ospite, aprire un documento nuovo o esistente in cui importare il testo riconosciuto. 4. Fare scendere il menu File dell’applicazione ospite e selezionare il comando TextBridge OCR. Appariranno dei messaggi di stato: Collegamento in corso con i servizi TextBridge... Collegamento con i servizi TextBridge avvenuto. Dopo alcuni secondi, appare la finestra di dialogo principale di TextBridge. 4–24 Manuale per l'utente di TextBridge 5. Impostare e avviare l’OCR dalla finestra principale. Quando la finestra principale è visualizzata, selezionare File o Scanner come sorgente di entrata, specificare le Preferenze e procedere esattamente come se si stesse usando TextBridge come applicazione a sé stante. ☞ Le opzioni Anteprima, Verifica e Salva immagini di pagina non sono disponibili nella versione con il server di applicazioni di TextBridge. Se sono richieste queste opzioni, eseguire TextBridge come applicazione a sé stante e salvare il testo riconosciuto nel formato di elaborazione testi o altro formato di cui si dispone. Consultare il Capitolo 3 per una descrizione dettagliata dell’utilizzo di TextBridge; consultare le sezioni precedenti del presente capitolo per i consigli e le tecniche di uso. Al termine dell’OCR, il server di applicazioni si chiude e il testo riconosciuto appare in corrispondenza della posizione del cursore nel documento aperto dell’applicazione, pronto per eventuali modifiche. ☞ Il server di applicazioni utilizza gli appunti (clipboard) di Windows per tagliare e incollare il testo riconosciuto nell’applicazione, come testo formattato RTF (Rich Text Format) o testo ordinario ASCII. Se l’applicazione supporta il formato RTF incollato dagli appunti, allora verrà utilizzato tale formato, altrimenti il testo riconosciuto verrà incollato come puro testo e la formattazione (grassetto, corsivo, ecc.) andrà persa. Consigli e tecniche 4–25 Uso della stampante TextBridge OCR Tra le sue funzioni, TextBridge OCR per Windows può riconoscere i file di immagini solo se sono memorizzati in formato TIFF. Alcune applicazioni, come i programmi per facsimile (fax), memorizzano le immagini di pagina di fax solo in formato PCX, DCX o altro formato privato. Per eseguire l’OCR su immagini non TIFF, si può utilizzare la stampante TextBridge OCR, che compare nelle applicazioni Windows come una qualsiasi stampante e consente di “stampare” un’immagine da un’applicazione Windows e produrre un file di testo di uscita riconosciuto e formattato. Un tipico utilizzo della stampante OCR consiste nell’eseguire l’OCR di un’immagine di pagina direttamente da un’applicazione per fax o di immagini. La stampante OCR è simile al modello di molti programmi fax che usano una caratteristica simile per inviare fax, ovvero l’immagine di fax viene “stampata” sul fax modem e inviata ad un altro fax o fax modem. Oltre ai normali vantaggi, la stampante OCR è in grado di riconoscere praticamente ogni formato di immagine (DCX, PCX, Corel, TIFF, ecc.) e può essere utilizzata da qualsiasi programma Windows in grado di gestire le immagini. Per preparare la stampante OCR all’uso, consultare la sottosezione seguente, “Aggiunta della stampante OCR”. Inoltre, consultare le istruzioni di caricamento di un’immagine e trasferimento su un file di testo contenute nella sezione “Uso della stampante OCR nell’applicazione di immagini”. Aggiunta della stampante OCR I file di programma della stampante OCR vengono installati insieme all’applicazione principale TextBridge. 4–26 Manuale per l'utente di TextBridge Tuttavia, come accade per i driver di stampante effettivi, occorre aggiungere la stampante OCR all’elenco di stampanti disponibili sul PC per le applicazioni Windows. Questa operazione presume che TextBridge sia già stato installato, secondo le istruzioni del Capitolo 2. 1. Dal Program Manager di Windows, aprire il gruppo di programmi Principale e fare doppio clic sull’icona del Pannello di controllo: Si aprirà la finestra del Pannello di controllo, contenente le icone delle varie parti del sistema. 2. Fare doppio clic sull’icona delle Stampanti, nella finestra del Pannello di controllo. Apparirà la finestra di dialogo Stampanti di Windows (Figura 4–17). Fare clic qui per visualizzare l’elenco delle stampanti Figura 4–17. Finestra di dialogo Stampanti Consigli e tecniche 4–27 3. Fare clic sul pulsante Aggiungi, nella finestra di dialogo Stampanti. La finestra di dialogo si ingrandisce per visualizzare l’Elenco stampanti che possono essere aggiunte. 4. Nell’elenco, evidenziare l’elemento seguente, poi fare clic sul pulsante Installa. Installa stampante non elencata o aggiornata Verrà visualizzata una finestra di dialogo di installazione del driver, in cui l’utente è invitato a specificare l’unità e la posizione nella directory del driver della stampante. 5. Nella finestra di dialogo di installazione del driver, immettere il nome di percorso della directory TextBridge BIN: c:\txbridge\bin 6. Fare clic su OK (o premere Invio). Verrà visualizzata una finestra di dialogo di aggiunta della stampante aggiornata o non elencata (Figura 4–18). Fare clic qui per aggiungere la stampante OCR Figura 4–18. Finestra di dialogo di aggiunta della stampante aggiornata o non elencata 4–28 Manuale per l'utente di TextBridge 7. Selezionare la stampante OCR e fare clic su OK. La finestra di dialogo di aggiunta della stampante aggiornata o non elencata si chiude, mentre rimane aperta la finestra di dialogo Stampanti. 8. Fare clic su Chiudi nella finestra di dialogo Stampanti per porre fine all’aggiunta di stampanti. A questo punto si può utilizzare la stampante TextBridge OCR come descritto nella sottosezione successiva. Uso della stampante OCR nell’applicazione di immagini La stampante OCR può essere utilizzata con tutte le applicazioni Windows da cui è possibile aprire e visualizzare file di immagini. Ad esempio, WinFax Pro (della Delrina Technology Inc.) è dotato di un visualizzatore di immagini che consente di vedere, modificare e stampare immagini di fax. Usando il comando Stampa del menu File di tale visualizzatore di WinFax, è possibile specificare e utilizzare la stampante OCR per eseguire il riconoscimento dei caratteri sull’immagine di fax. La stampante OCR consente di accedere alle Preferenze di TextBridge prima dell’inizio del riconoscimento. Al termine di questo, si può specificare il nome del file, la collocazione e il formato di uscita del testo, nella finestra di dialogo standard Salva con nome di TextBridge. Per utilizzare la stampante OCR nell’applicazione, fare quanto segue: Consigli e tecniche 4–29 1. Aprire l’applicazione di immagini e visualizzare l’immagine da sottoporre a riconoscimento. ☞ L’immagine deve essere binaria (in bianco e nero) e rientrare nella gamma di risoluzioni supportate da TextBridge. TextBridge è in grado di riconoscere leimmagini di 100 per 200, 200 per 100, 200 per 200, 300 per 300 e 400 per 400 punti per pollice. 2. Nella finestra di dialogo di impostazione stampanti dell’applicazione, specificare la stampante TextBridge OCR come stampante di destinazione. A questo punto, la stampante OCR dovrebbe già essere stata aggiunta al programma Stampanti del Pannello di controllo di Windows, secondo quanto descritto nella sottosezione precedente, “Aggiunta della stampante OCR”. 3. Se si vuole, è possibile definire le preferenze TextBridge. • Fare clic sul pulsante Opzioni o Imposta, nella finestra di impostazione stampanti dell’appli- cazione in uso. Verrà visualizzata un’altra finestra di impostazione. • Fare clic sul pulsante Preferenze nella finestra di impostazione, per visualizzare la finestra di dialogo Preferenze di TextBridge. • Specificare la qualità di documento standard o fax, l’orientamento pagina, la segmentazione automatica, ecc. • Al termine delle selezioni, fare clic su OK nella finestra di dialogo Preferenze e uscire anche dalle altre finestre. 4–30 Manuale per l'utente di TextBridge ☞ Nella finestra di dialogo di impostazione stampanti dell’applicazione in uso, se è disponibile un’opzione per usare l’effettiva risoluzione della stampante, attivarla. 4. Avviare il riconoscimento OCR sull’immagine visualizzata. • Dall’interno dell’applicazione, fare scendere il menu File e selezionare Stampa. • Fare clic su OK nella finestra di dialogo Stampa. A questo punto appaiono dei messaggi sullo svolgimento del riconoscimento OCR in corso: Elaborazione in corso... Acquisizione immagine in corso... Riconoscimento testo in corso... Al termine del riconoscimento, appare la finestra di dialogo di TextBridge Salva con nome (Figura 4–19). Specificare il nome del file e la directory di uscita Specificare il formato di uscita Figura 4–19. Finestra di dialogo Salva con nome 5. Specificare il nome del file di uscita, il formato, l’unità disco e la directory di destinazione, poi fare clic su OK. Il file di testo riconosciuto viene convertito nel formato specificato e scritto sul disco fisso. Consigli e tecniche 4–31