Hoe kan jy toegang tot die onttrekte teks van 'n prent kry deur die Google Vision API te gebruik?

by EITCA Akademie / Woensdag 27 Desember 2023 / gepubliseer in Kunsmatige Intelligensie, EITC/AI/GVAPI Google Vision API, Begrip van teks in visuele data, Opspoor en onttrek teks uit die handskrif, Eksamen hersiening

Om toegang te verkry tot die onttrekte teks van 'n prent met behulp van die Google Vision API, kan jy 'n reeks stappe volg wat die gebruik van die Optical Character Recognition (OCR)-vermoëns van die API behels. Die OCR-tegnologie in die Google Vision API maak die opsporing en onttrekking van teks uit beelde moontlik, insluitend handskrif. Hierdie funksionaliteit is veral nuttig in toepassings wat die ontleding en begrip van tekstuele inligting wat in visuele data voorkom, vereis.

Eerstens moet jy die nodige omgewing opstel om met die Google Vision API te werk. Dit behels die skep van 'n projek in die Google Wolkkonsole, die aktivering van die Vision API, en die verkryging van die vereiste stawingbewyse soos 'n API-sleutel of diensrekeningsleutel.

Sodra jou omgewing opgestel is, kan jy van die Vision API se `asyncBatchAnnotateFiles`-metode gebruik maak om OCR op 'n beeldlêer uit te voer. Hierdie metode laat jou toe om 'n lys beeldlêers vir verwerking deur te gee en die resultate asynchronies te ontvang. Alternatiewelik kan jy die `asyncBatchAnnotateImages`-metode gebruik om 'n lys beelde direk te verwerk.

Om teks uit 'n prent te onttrek, moet jy 'n instansie van die `AnnotateImageRequest`-objek skep en die verlangde kenmerke spesifiseer. In hierdie geval sal jy die `TEXT_DETECTION`-kenmerk stel om aan te dui dat jy teks uit die prent wil onttrek. Jy kan ook bykomende parameters spesifiseer soos die taalwenk om die akkuraatheid van die OCR te verbeter.

Vervolgens moet jy die beeldlêer in 'n base64-gekodeerde string enkodeer en 'n instansie van die `Beeld`-objek skep deur die geënkodeerde beelddata te gebruik. Hierdie `Image`-objek moet bygevoeg word by die `AnnotateImageRequest`-objek wat vroeër geskep is.

Nadat jy die versoek opgestel het, kan jy dit na die Vision API stuur deur die `batchAnnotateImages` of `batchAnnotateFiles` metode, afhangende van jou gekose benadering. Die API sal die prent verwerk en 'n antwoord terugstuur wat die onttrekte teks bevat.

Om toegang tot die onttrekte teks uit die antwoord te verkry, kan jy oor die `textAnnotations`-veld van die `AnnotateImageResponse`-voorwerp herhaal. Hierdie veld bevat 'n lys van `EntityAnnotation`-objekte, wat elkeen 'n bespeurde tekselement in die prent verteenwoordig. Die `beskrywing`-veld van elke `EntityAnnotation`-objek bevat die onttrekte teks.

Hier is 'n voorbeeldkodebrokkie in Python wat demonstreer hoe om toegang tot die onttrekte teks vanaf 'n prent te verkry met behulp van die Google Vision API:

python
from google.cloud import vision

def extract_text_from_image(image_path):
    client = vision.ImageAnnotatorClient()

    with open(image_path, 'rb') as image_file:
        content = image_file.read()

    image = vision.Image(content=content)

    request = vision.AnnotateImageRequest(
        image=image,
        features=[{'type': vision.Feature.Type.TEXT_DETECTION}]
    )

    response = client.batch_annotate_images(requests=[request])

    for annotation in response.responses[0].text_annotations:
        extracted_text = annotation.description
        print(extracted_text)

# Usage
extract_text_from_image('path_to_image.jpg')

In hierdie voorbeeld neem die `extract_text_from_image`-funksie die pad na 'n prentlêer as invoer en gebruik die Google Cloud Vision-kliëntbiblioteek om 'n versoek na die Vision API te stuur. Die onttrekte teks word dan uitgedruk.

Om toegang te verkry tot die onttrekte teks vanaf 'n prent met behulp van die Google Vision API, moet jy die omgewing opstel, 'n `AnnotateImageRequest`-objek met die verlangde kenmerke skep, die prentlêer enkodeer, die versoek na die API stuur en die onttrekte teks herwin uit die reaksie. Die OCR-vermoëns van die Vision API maak die opsporing en onttrekking van teks uit beelde moontlik, insluitend handskrif.

Ander onlangse vrae en antwoorde t.o.v Opspoor en onttrek teks uit die handskrif:

Meer vrae en antwoorde:

gebied: Kunsmatige Intelligensie
program: EITC/AI/GVAPI Google Vision API (gaan na die sertifiseringsprogram)
les: Begrip van teks in visuele data (gaan na verwante les)
Onderwerp: Opspoor en onttrek teks uit die handskrif (gaan na verwante onderwerp)
Eksamen hersiening

Gemerk onder: Kunsmatige Intelligensie, Google Cloud Vision API, Beeldverwerking, OCR, Optiese karakter herkenning, Teksontginning

EITCA Akademie

Hoe kan jy toegang tot die onttrekte teks van 'n prent kry deur die Google Vision API te gebruik?

Ander onlangse vrae en antwoorde t.o.v Opspoor en onttrek teks uit die handskrif:

Meer vrae en antwoorde:

EITCA Akademie is deel van die Europese IT-sertifiseringsraamwerk

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support

EITCA Akademie

Teken in op u rekening deur u gebruikersnaam of e-posadres

VERGELY JOU BESONDERHEDE?

MAAK 'N REKENING OOP

Hoe kan jy toegang tot die onttrekte teks van 'n prent kry deur die Google Vision API te gebruik?

Ander onlangse vrae en antwoorde t.o.v Opspoor en onttrek teks uit die handskrif:

Meer vrae en antwoorde:

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie ​​support

Geskiktheid vir EITCA Academy 80% EITCI DSJC Subsidie support