OCR (riconoscimento ottico dei caratteri)

OCR (riconoscimento ottico dei caratteri) con l'IA di Google Cloud di altissimo livello

Estrai testo e dati da immagini e documenti, trasforma contenuti non strutturati in dati strutturati pronti per l'uso aziendale e accedi a insight preziosi.

Integra le funzionalità OCR nelle tue applicazioni tramite API.

I nuovi clienti ricevono 300 $ di crediti gratuiti al momento della registrazione da usare sulle soluzioni OCR per il riepilogo di documenti.

Panoramica

Che cos'è l'OCR?

Il riconoscimento ottico dei caratteri (OCR) è una tecnologia fondamentale alla base della conversione del testo digitato, scritto a mano o stampato dalle immagini in testo codificato automaticamente. 

Quali tipi di OCR offre Google Cloud?

Google Cloud offre due tipi di OCR: OCR per i documenti e OCR per immagini e video.

Sebbene condividano la stessa tecnologia di base, Document AI è una piattaforma di comprensione dei documenti ottimizzata per l'elaborazione. Il suo Custom Extractor si basa su GenAI , in grado di elaborare documenti generici e specifici del dominio con maggiore accuratezza e in modo più rapido, senza la necessità di scegliere un processore specializzato. 

Cloud Vision viene comunemente utilizzato per rilevare testo, scrittura a mano libera e una vasta gamma di oggetti da immagini e video.

Come funziona l'OCR in Google Cloud

Google Cloud supporta la tecnologia OCR con l'AI migliore del settore. Va ben oltre il riconoscimento di testo tradizionale, in quanto comprende, organizza e arricchisce i dati, generando infine insight pronti per l'uso aziendale. 

Offre la flessibilità di utilizzare gli strumenti OCR come suite unificata per una maggiore efficienza (ad es.Document AI) o semplicemente di chiamare le API pertinenti direttamente nella console Google Cloud per integrare le funzionalità di OCR nelle tue applicazioni.

Come interagiscono AI e OCR di Google Cloud?

Tutte le soluzioni OCR menzionate sopra ti permettono di accedere a modelli di machine learning preaddestrati di cui puoi eseguire il deployment immediatamente tramite un'API o di cui puoi ottimizzare l'addestramento per migliorare l'accuratezza in base alle tue esigenze specifiche. 

Puoi anche addestrare i tuoi modelli personalizzati con AutoML, senza bisogno di competenze nel machine learning. 

Consulta la documentazione di AutoML per la creazione di modelli di machine learning personalizzati.

Qual è la soluzione OCR giusta per me?

Se vuoi analizzare un documento o creare una pipeline di elaborazione automatica dei documenti, utilizza Document AI - Si occupa dell'intero flusso di lavoro in un'unica posizione, dalla comprensione dei documenti alla ricerca, all'archiviazione, all'organizzazione e alla gestione dei documenti insieme ai dati estratti.

Se vuoi analizzare ed elaborare le immagini, usa Cloud Vision insieme ad altri prodotti Google Cloud per ottenere risultati ottimali. Per informazioni dettagliate e per le guide rapide, consulta la sezione Utilizzi comuni.

Entrambe le API si possono provare gratuitamente con un account Google Cloud.

Confronta le offerte di OCR

Offerta OCRIdeale perFunzionalità principali

Casi d'uso generici per l'estrazione del testo che richiedono bassa latenza e capacità elevata.

Funzionalità predefinite come etichettatura delle immagini, rilevamento di volti e punti di riferimento, OCR, ricerca sicura. 

Enterprise Document OCR

Digitalizza il testo dei documenti (PDF, documenti scansionati come immagini o file Microsoft DocX).

Estrai testo in oltre 200 lingue e 50 lingue scritte a mano.

Componenti aggiuntivi per il riconoscimento di formule matematiche, stili e così via.



Document AI Workbench

Estrarre, classificare e suddividere qualsiasi documento con l'IA generativa (modelli di base)

Custom Extractor: utilizza modelli di base per creare rapidamente parser senza etichettare o addestrare i dati in modo esaustivo.

Classificatore personalizzato e divisione documenti per un'elaborazione efficiente.

Modelli preaddestrati

Estrazione di testo e campi da documenti specifici del dominio.

Estrazione e digitalizzazione del testo su una vasta gamma di documenti relativi all'approvvigionamento, ai mutui,documenti di identità e documenti contrattuali.

Ideale per

Funzionalità principali

Casi d'uso generici per l'estrazione del testo che richiedono bassa latenza e capacità elevata.

Funzionalità predefinite come etichettatura delle immagini, rilevamento di volti e punti di riferimento, OCR, ricerca sicura. 

Ideale per

Enterprise Document OCR

Funzionalità principali

Digitalizza il testo dei documenti (PDF, documenti scansionati come immagini o file Microsoft DocX).

Estrai testo in oltre 200 lingue e 50 lingue scritte a mano.

Componenti aggiuntivi per il riconoscimento di formule matematiche, stili e così via.



Ideale per

Document AI Workbench

Funzionalità principali

Estrarre, classificare e suddividere qualsiasi documento con l'IA generativa (modelli di base)

Custom Extractor: utilizza modelli di base per creare rapidamente parser senza etichettare o addestrare i dati in modo esaustivo.

Classificatore personalizzato e divisione documenti per un'elaborazione efficiente.

Ideale per

Modelli preaddestrati

Funzionalità principali

Estrazione di testo e campi da documenti specifici del dominio.

Estrazione e digitalizzazione del testo su una vasta gamma di documenti relativi all'approvvigionamento, ai mutui,documenti di identità e documenti contrattuali.

Come funziona

Per comprendere ed elaborare i documenti, utilizza Document AI.

Per le immagini, ti consigliamo di utilizzare Cloud Vision.

Entrambe offrono l'accesso a modelli di machine learning preaddestrati di cui è possibile eseguire il deployment tramite API o ottimizzare l'addestramento. Puoi anche addestrare i tuoi modelli personalizzati da zero con AutoML, senza bisogno di competenze nel machine learning. 

Le prime 1000 unità al mese sono gratuite quando utilizzi Cloud Vision o Document OCR: prova con una semplice chiamata API.

immagine che mostra i prodotti Cloud che interagiscono
In che modo Cloud Vision riconosce e classifica le immagini

Demo

Guarda l'OCR di documenti in azione con i tuoi documenti

Prova l'API Document AI con un semplice trascinamento.

Utilizzi comuni

Estrai testo dai documenti con l'IA generativa

Estrai insight da documenti articolati con Document AI

Basato su un modello di base, Document AI Custom Extractor estrae testo e dati dai documenti, generici e specifici per il dominio, più velocemente e con maggiore accuratezza. Facile ottimizzazione con soli 5-10 documenti per prestazioni ancora migliori.

 Se vuoi addestrare un modello personalizzato, etichetta automaticamente i set di dati con il modello di base per velocizzare i tempi di produzione.

Oppure puoi scegliere di utilizzare processori specializzati preaddestrati: consulta l'elenco completo dei processori


Esegui il deployment dell'API Document AI

Estrai insight da documenti articolati con Document AI

Basato su un modello di base, Document AI Custom Extractor estrae testo e dati dai documenti, generici e specifici per il dominio, più velocemente e con maggiore accuratezza. Facile ottimizzazione con soli 5-10 documenti per prestazioni ancora migliori.

 Se vuoi addestrare un modello personalizzato, etichetta automaticamente i set di dati con il modello di base per velocizzare i tempi di produzione.

Oppure puoi scegliere di utilizzare processori specializzati preaddestrati: consulta l'elenco completo dei processori


Esegui il deployment dell'API Document AI

Mr. Cooper utilizza l'IA di Google per velocizzare l'elaborazione dei mutui

Mr. Cooper è uno dei più grandi fornitori di servizi per la concessione di prestiti domestici del paese e si concentra sulla fornitura di vari prodotti, servizi e tecnologie ai proprietari di case.

Ha creato una pipeline di elaborazione di documenti basata su container con un'architettura modulare sullo stack tecnologico OCR di Google e ha ottenuto i seguenti risultati:

- Precisione oltre il 95% per i documenti critici.

- Velocità effettiva massima di 4000 pagine/min, una velocità effettiva media di 2000 pagine/min.

- Ha aumentato l'efficienza dell'elaborazione dei documenti del 400%.

Leggi il case study completo per i dettagli tecnici
Diagramma dell'architettura della pipeline di elaborazione di documenti di Mr. Cooper

    Crea una soluzione end-to-end per i documenti

    Crea una pipeline di elaborazione e comprensione dei documenti

    Basato su GenAI, Document AI offre un'elevata accuratezza nell'estrazione dei dati da documenti con layout e qualità diversi. Puoi collegarlo a Cloud Storage in modo che i tuoi documenti non strutturati siano conformi a livello aziendale. BigQuery aiuta a elaborare e analizzare in batch i dati estratti come preferisci. Con Looker puoi creare facilmente visualizzazioni basate sulle tue tabelle BigQuery. Vertex AI Search consente di eseguire query sui documenti e cercarli in Cloud Storage, in modo conversazionale o tradizionale.

    Esegui il deployment dell'API Document AI
    Architettura di riferimento di una soluzione end-to-end per i documenti con più prodotti Google Cloud

    La configurazione dell'intera pipeline come visto richiede 60-90 minuti, mentre la parte di Document AI richiede 10 minuti.

    Crea una pipeline di elaborazione e comprensione dei documenti

    Basato su GenAI, Document AI offre un'elevata accuratezza nell'estrazione dei dati da documenti con layout e qualità diversi. Puoi collegarlo a Cloud Storage in modo che i tuoi documenti non strutturati siano conformi a livello aziendale. BigQuery aiuta a elaborare e analizzare in batch i dati estratti come preferisci. Con Looker puoi creare facilmente visualizzazioni basate sulle tue tabelle BigQuery. Vertex AI Search consente di eseguire query sui documenti e cercarli in Cloud Storage, in modo conversazionale o tradizionale.

    Esegui il deployment dell'API Document AI
    Architettura di riferimento di una soluzione end-to-end per i documenti con più prodotti Google Cloud

    La configurazione dell'intera pipeline come visto richiede 60-90 minuti, mentre la parte di Document AI richiede 10 minuti.

    Estrai testo dalle immagini

    Estrai testo dalle immagini con l'API Cloud Vision

    Tramite l'API Cloud Vision, puoi rilevare ed estrarre testo e scrittura a mano libera da qualsiasi immagine in lingue diverse. Inoltre è disponibile il supporto di più regioni per il quale è possibile specificare l'archiviazione dei dati a livello di continente e l'elaborazione OCR.

    Puoi scegliere di ottenere risultati immediati per un numero ridotto di immagini (fino a 16 per richiesta) o di elaborare in batch un numero maggiore di immagini (fino a 2000 per richiesta) in modo asincrono per ottenere un risultato in un secondo momento.

    Implementa l'API Cloud Vision
    architettura di riferimento dell'API Cloud Vision

    Estrai testo dalle immagini con l'API Cloud Vision

    Tramite l'API Cloud Vision, puoi rilevare ed estrarre testo e scrittura a mano libera da qualsiasi immagine in lingue diverse. Inoltre è disponibile il supporto di più regioni per il quale è possibile specificare l'archiviazione dei dati a livello di continente e l'elaborazione OCR.

    Puoi scegliere di ottenere risultati immediati per un numero ridotto di immagini (fino a 16 per richiesta) o di elaborare in batch un numero maggiore di immagini (fino a 2000 per richiesta) in modo asincrono per ottenere un risultato in un secondo momento.

    Implementa l'API Cloud Vision
    architettura di riferimento dell'API Cloud Vision

    Esempio di prezzi

    Per eseguire una pipeline di elaborazione di base che estrae il testo dalle immagini come mostrato a destra, il costo mensile è di 27,36 $.

    Puoi verificare le ipotesi di utilizzo effettuate per arrivare a questo numero nel Calcolatore prezzi.

    Le prime 1000 unità al mese sono gratuite.

    Contattaci per una configurazione più complessa
    elaborazione immagini

      Prezzi

      Quanto costa il mio caso d'uso?Comprendi il costo mensile per la risoluzione di un caso d'uso, tenendo traccia dei prodotti che ti servono e formulando le principali ipotesi sull'utilizzo.
      Caso d'usoProdotti utilizzatiIpotesi di utilizzoCosto mensile stimato ($)
      Tagging, elaborazione e ricerca delle immagini

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      1. 15.000 chiamate API di rilevamento etichette Cloud Vision al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. Una CPU da 1,25 GiB

      4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub

      Visualizza i dettagli del calcolo nel calcolatore

      27,36 $

      Estrazione di testi e insight dai documenti

      Document AI

      Cloud Storage

      BigQuery

      Cloud Functions

      1. 1000 chiamate API di analizzatore sintattico di moduli Document AI al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. 1 TiB di query al mese

      4. RAM: 512 MB, CPU: 800 MHz

      Visualizza i dettagli del calcolo nel calcolatore

      71,87 $

      Estrai testo dalle immagini

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      1. 15.000 chiamate API di OCR Cloud Vision al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. Una CPU da 1,25 GiB

      4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub

      Visualizza i dettagli del calcolo nel calcolatore

      27,36 $

      Visualizza i dettagli completi dei prezzi delle unità per Document AI, API Vision e AutoML.

      Quanto costa il mio caso d'uso?

      Comprendi il costo mensile per la risoluzione di un caso d'uso, tenendo traccia dei prodotti che ti servono e formulando le principali ipotesi sull'utilizzo.

      Tagging, elaborazione e ricerca delle immagini
      Prodotti utilizzati

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      Ipotesi di utilizzo

      1. 15.000 chiamate API di rilevamento etichette Cloud Vision al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. Una CPU da 1,25 GiB

      4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub

      Visualizza i dettagli del calcolo nel calcolatore

      Costo mensile stimato ($)

      27,36 $

      Estrazione di testi e insight dai documenti
      Prodotti utilizzati

      Document AI

      Cloud Storage

      BigQuery

      Cloud Functions

      Ipotesi di utilizzo

      1. 1000 chiamate API di analizzatore sintattico di moduli Document AI al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. 1 TiB di query al mese

      4. RAM: 512 MB, CPU: 800 MHz

      Visualizza i dettagli del calcolo nel calcolatore

      Costo mensile stimato ($)

      71,87 $

      Estrai testo dalle immagini
      Prodotti utilizzati

      Cloud Vision

      Cloud Storage

      Pub/Sub

      Cloud Run

      Ipotesi di utilizzo

      1. 15.000 chiamate API di OCR Cloud Vision al mese

      2. 100 GiB di spazio di archiviazione al mese

      3. Una CPU da 1,25 GiB

      4. Quattro GiB pubblicati ogni giorno tramite Pub/Sub

      Visualizza i dettagli del calcolo nel calcolatore

      Costo mensile stimato ($)

      27,36 $

      Visualizza i dettagli completi dei prezzi delle unità per Document AI, API Vision e AutoML.

      Calcolatore prezzi

      Stima il costo del tuo progetto inserendo tutti gli strumenti che ti servono in un unico posto.

      Preventivo personalizzato

      Contatta il nostro team di vendita per ricevere un preventivo personalizzato per le esigenze specifiche della tua organizzazione.

      Inizia la tua proof of concept

      I nuovi clienti ricevono fino a 300 $ di crediti gratuiti per provare i prodotti Google Cloud

      Hai un progetto di grandi dimensioni?

      Visualizza esempi di codice per soluzioni e casi d'uso di OCR

      Scopri come rilevare le etichette con l'API Cloud Vision

      Scopri come automatizzare una pipeline di elaborazione di documenti con Google AI

      Google Cloud
      • ‪English‬
      • ‪Deutsch‬
      • ‪Español‬
      • ‪Español (Latinoamérica)‬
      • ‪Français‬
      • ‪Indonesia‬
      • ‪Italiano‬
      • ‪Português (Brasil)‬
      • ‪简体中文‬
      • ‪繁體中文‬
      • ‪日本語‬
      • ‪한국어‬
      Console
      Google Cloud