Softver za prepoznavanje teksta

Po pravilu, kada su u pitanju programi za prepoznavanje skeniranog teksta (OCR, optičko prepoznavanje znakova), većina korisnika pamti jedini proizvod - ABBYY FineReader, koji je bez sumnje lider među takvim softverom u Rusiji i jedan od lidera u svetu.

Ipak, FineReader nije jedino rješenje ove vrste: postoje besplatni programi za prepoznavanje teksta, online usluge za iste svrhe i, štaviše, takve funkcije su također prisutne u nekim poznatim programima koji su možda već instalirani na vašem računalu. . Pokušaću pisati o svemu ovome u ovom članku. Svi razmatrani programi rade u Windowsima 7, 8 i XP.

Vođa prepoznavanja teksta - ABBYY Finereader

O FineReaderu (koji se izgovara kao Fine Reader) čuli ste, verovatno, većinu vas. Ovaj program je najbolji ili jedan od najboljih za visokokvalitetno prepoznavanje teksta na ruskom jeziku. Program se plaća, a cijena licence za kućnu upotrebu je nešto manja od 2000 rubalja. Takođe je moguće preuzeti probnu verziju FineReader-a ili koristiti online prepoznavanje teksta u ABBYY Fine Reader Online (možete prepoznati nekoliko stranica besplatno, a zatim - uz naknadu). Sve je to dostupno na službenoj web lokaciji za razvojne programere //www.abbyy.ru.

Instaliranje probne verzije FineReadera nije izazvalo nikakve probleme. Softver se može integrisati sa Microsoft Officeom i Windows Explorerom kako bi olakšao pokretanje prepoznavanja. Od ograničenja besplatne probne verzije - 15 dana korišćenja i mogućnost prepoznavanja ne više od 50 stranica.

Snimak ekrana za testiranje softvera za prepoznavanje

Budući da nemam skener, koristio sam snimak sa telefona slabe kvalitete, u kojem sam lagano uredio kontrast da bih provjerio. Kvalitet nije dobar, hajde da vidimo ko ga može podnijeti.

Meni FineReader

FineReader može dobiti grafičku sliku teksta direktno iz skenera, iz grafičkih datoteka ili fotoaparata. U mom slučaju, bilo je dovoljno otvoriti slikovnu datoteku. Rezultat je bio zadovoljan - samo nekoliko grešaka. Odmah ću reći da je ovo najbolji rezultat svih testiranih programa kada radim sa ovim uzorkom - sličan kvalitet prepoznavanja bio je samo na besplatnoj online usluzi Free Online OCR (ali u ovom pregledu govorimo samo o softveru, a ne online prepoznavanju).

Rezultat prepoznavanja teksta u FineReader-u

Iskreno govoreći, FineReader vjerojatno nema konkurenciju za ćirilične tekstove. Prednosti programa su ne samo kvalitet prepoznavanja teksta, već i široka funkcionalnost, podrška pri formatiranju, kompetentan izvoz u mnoge formate, uključujući Word docx, pdf i druge mogućnosti. Dakle, ako je OCR zadatak nešto s čime se stalno susrećete, onda nemojte žaliti za relativno malom količinom novca i to će se isplatiti: uštedjet ćete ogromnu količinu vremena, brzo dobiti kvalitetne rezultate u FineReaderu. Inače, ne reklamiram ništa - stvarno mislim da bi oni koji treba da prepoznaju više od desetak stranica razmišljati o kupovini takvog softvera.

CuneiForm je besplatan program za prepoznavanje teksta.

Po mojoj proceni, drugi najpopularniji OCR program u Rusiji je besplatan CuneiForm, koji se može preuzeti sa zvaničnog sajta //cognitiveforms.ru/products/cuneiform/.

Instalacija programa je takođe veoma jednostavna, ne pokušava da instalira bilo koji softver treće strane (kao što je mnogo slobodnog softvera). Sučelje je sažeto i jasno. U nekim slučajevima, najlakši način da koristite čarobnjaka, koji je prvi od ikona u meniju.

Uz uzorak koji sam koristio u FineReaderu, program se nije nosio, ili, preciznije, dao nešto loše čitljivo i fragmente riječi. Drugi pokušaj je napravljen sa snimkom ekrana teksta sa sajta samog programa, koji je, međutim, morao da se poveća (potrebno mu je skeniranje sa rezolucijom od 200 dpi i više, ne čita slike ekrana sa širinom fontova od 1-2 piksela). Ovde je dobro radila (neki tekst nije prepoznat, jer je izabran samo ruski).

CuneiForm prepoznavanje teksta

Dakle, možemo pretpostaviti da je CuneiForm nešto što biste trebali isprobati, pogotovo ako imate skenirane stranice visokog kvaliteta i želite ih prepoznati besplatno.

Microsoft OneNote - program koji možda već imate

U Microsoft Officeu, počevši od verzije 2007, a završava trenutnom, 2013, postoji program za beleženje - OneNote. Takođe ima funkcije prepoznavanja teksta. Da biste ga koristili, jednostavno zalijepite skeniranu ili neku drugu tekstualnu sliku u bilješku, kliknite desnim klikom na nju i koristite kontekstni izbornik. Napominjem da je podrazumevano podešavanje postavljeno na engleski.

Prepoznavanje u programu Microsoft OneNote

Ne mogu reći da se tekst savršeno prepoznaje, ali, koliko ja mogu reći, on je nešto bolji čak i od CuneiForm-a. Plus, program, kao što je već pomenuto, je da je sa velikom verovatnoćom već instaliran na vašem računaru. Iako, naravno, njegova upotreba u slučaju potrebe za radom sa velikim brojem skeniranih dokumenata nije vjerovatno zgodna, već je pogodna za brzo prepoznavanje posjetnica.

OmniPage Ultimate, OmniPage 18 - mora biti nešto jako cool

Ne znam koliko je dobar OmniPage softver za prepoznavanje teksta: ne postoje probne verzije, ne želim da ga preuzmem negdje. Ali, ako je njegova cena opravdana, a koštaće oko 5.000 rubalja u verziji za individualnu upotrebu a ne Ultimate, onda bi to trebalo da bude nešto impresivno. Program Page: //www.nuance.com/for-individuals/by-product/omnipage/index.htm

OmniPage softverska cijena

Ako pročitate karakteristike i recenzije, uključujući i one u publikacijama na ruskom jeziku, oni napominju da OmniPage zaista pruža visokokvalitetno i precizno prepoznavanje, uključujući i ruski, relativno je lako rastaviti ne najkvalitetnije skeniranje i pružiti skup dodatnih alata. Od nedostataka, to nije najpogodnije, pogotovo za početnike, sučelje. Uostalom, na zapadnom tržištu OmniPage je direktni konkurent FineReader-a iu engleskom jeziku oni se bore upravo među sobom, i stoga, mislim, program treba da bude dostojan.

Ovo nisu svi programi ovog tipa, postoje i razne opcije za male besplatne programe, ali dok sam eksperimentisao s njima, našao sam dva glavna nedostatka koja su im inherentna: nedostatak ćirilične podrške ili drugačiji, ne baš koristan softver u instalacionom kompletu, pa sam stoga odlučio da ih ne spominjem ovdje

Pogledajte video: Prepoznavanje teksta sa slike online (Novembar 2024).