Om toegang te verkry tot die onttrekte teks van 'n prent met behulp van die Google Vision API, kan jy 'n reeks stappe volg wat die gebruik van die Optical Character Recognition (OCR)-vermoëns van die API behels. Die OCR-tegnologie in die Google Vision API maak die opsporing en onttrekking van teks uit beelde moontlik, insluitend handskrif. Hierdie funksionaliteit is veral nuttig in toepassings wat die ontleding en begrip van tekstuele inligting wat in visuele data voorkom, vereis.
Eerstens moet jy die nodige omgewing opstel om met die Google Vision API te werk. Dit behels die skep van 'n projek in die Google Wolkkonsole, die aktivering van die Vision API, en die verkryging van die vereiste stawingbewyse soos 'n API-sleutel of diensrekeningsleutel.
Sodra jou omgewing opgestel is, kan jy van die Vision API se `asyncBatchAnnotateFiles`-metode gebruik maak om OCR op 'n beeldlêer uit te voer. Hierdie metode laat jou toe om 'n lys beeldlêers vir verwerking deur te gee en die resultate asynchronies te ontvang. Alternatiewelik kan jy die `asyncBatchAnnotateImages`-metode gebruik om 'n lys beelde direk te verwerk.
Om teks uit 'n prent te onttrek, moet jy 'n instansie van die `AnnotateImageRequest`-objek skep en die verlangde kenmerke spesifiseer. In hierdie geval sal jy die `TEXT_DETECTION`-kenmerk stel om aan te dui dat jy teks uit die prent wil onttrek. Jy kan ook bykomende parameters spesifiseer soos die taalwenk om die akkuraatheid van die OCR te verbeter.
Vervolgens moet jy die beeldlêer in 'n base64-gekodeerde string enkodeer en 'n instansie van die `Beeld`-objek skep deur die geënkodeerde beelddata te gebruik. Hierdie `Image`-objek moet bygevoeg word by die `AnnotateImageRequest`-objek wat vroeër geskep is.
Nadat jy die versoek opgestel het, kan jy dit na die Vision API stuur deur die `batchAnnotateImages` of `batchAnnotateFiles` metode, afhangende van jou gekose benadering. Die API sal die prent verwerk en 'n antwoord terugstuur wat die onttrekte teks bevat.
Om toegang tot die onttrekte teks uit die antwoord te verkry, kan jy oor die `textAnnotations`-veld van die `AnnotateImageResponse`-voorwerp herhaal. Hierdie veld bevat 'n lys van `EntityAnnotation`-objekte, wat elkeen 'n bespeurde tekselement in die prent verteenwoordig. Die `beskrywing`-veld van elke `EntityAnnotation`-objek bevat die onttrekte teks.
Hier is 'n voorbeeldkodebrokkie in Python wat demonstreer hoe om toegang tot die onttrekte teks vanaf 'n prent te verkry met behulp van die Google Vision API:
python from google.cloud import vision def extract_text_from_image(image_path): client = vision.ImageAnnotatorClient() with open(image_path, 'rb') as image_file: content = image_file.read() image = vision.Image(content=content) request = vision.AnnotateImageRequest( image=image, features=[{'type': vision.Feature.Type.TEXT_DETECTION}] ) response = client.batch_annotate_images(requests=[request]) for annotation in response.responses[0].text_annotations: extracted_text = annotation.description print(extracted_text) # Usage extract_text_from_image('path_to_image.jpg')
In hierdie voorbeeld neem die `extract_text_from_image`-funksie die pad na 'n prentlêer as invoer en gebruik die Google Cloud Vision-kliëntbiblioteek om 'n versoek na die Vision API te stuur. Die onttrekte teks word dan uitgedruk.
Om toegang te verkry tot die onttrekte teks vanaf 'n prent met behulp van die Google Vision API, moet jy die omgewing opstel, 'n `AnnotateImageRequest`-objek met die verlangde kenmerke skep, die prentlêer enkodeer, die versoek na die API stuur en die onttrekte teks herwin uit die reaksie. Die OCR-vermoëns van die Vision API maak die opsporing en onttrekking van teks uit beelde moontlik, insluitend handskrif.
Ander onlangse vrae en antwoorde t.o.v Opspoor en onttrek teks uit die handskrif:
- Watter beperkings kan ontstaan wanneer teks uit komplekse dokumente met die Google Vision API onttrek word?
- Wat is die betekenis van vertrouensvlakke in die Google Vision API se interpretasie van teks?
- Hoe kan die Google Vision API akkuraat herken en teks uit handgeskrewe notas onttrek?
- Wat is die uitdagings om teks uit handgeskrewe beelde op te spoor en te onttrek?
- Kan Google Vision handskrif herken?