Whatsapp

gImageReader – Extrahujte text z obrázků a PDF v Linuxu

Anonim

gImageReader je bezplatná čtečka PDF s otevřeným zdrojovým kódem se schopností extrahovat text z obrázků a souborů PDF. Je vytvořen jako jednoduchý Gtk/Qt front-end pro Tesseract-OCR, open-source OCR engine pro rozpoznávání textů a vzorů v dokumentech a obrázcích pomocíUmělá inteligence

Sám o sobě je Tesseract nástroj příkazového řádku, který je omezen na použití uživateli Linuxu, kteří jsou dostatečně obeznámeni s jejich terminály. Díky gImageReader nyní může každý využít efektivitu OCR motoru.

gImageReader funguje tak, že skenuje texty z PDF nebo obrázkového souboru v některém z několika jazyků, které podporuje díky existenci znaků Unicode . Obsahuje jednoduché, dobře organizované přizpůsobitelné uživatelské rozhraní, jehož prostřednictvím můžete provádět kontrolu pravopisu a překladatelské úkoly.

Funkce v gImageReader

gImageReader se snadno používá a podporuje práci s dokumenty v elektronické podobě a také se snímky nahraných médií, např. snímky obrazovky. Máte dokonce možnost vybrat oblast textu, která vás zajímá, a přidat pouze text, který potřebujete. gImagereader funguje jako čtečka PDF i jako nástroj pro extrakci textu. Blbé věci.

Nainstalovat gImageReader v systému Linux

Abyste mohli gImageReader využívat naplno, musíte ručně nainstalovat Tesseract jazykové balíčky, abyste mohli správně analyzovat obrázky a soubory.Balíček se nazývá 'Tesseract-ocr-eng' a je k dispozici u správce softwaru v Debiana Fedora distribuce.

Pokud používáte Ubuntu, můžete jednoduše přidat PPAa spusťte instalační příkaz pomocí následujících příkazů:

$ sudo add-apt-repository ppa:sandromani/gimagereader
$ aktualizace sudo apt
$ sudo apt nainstalovat gimagereader

Zapnuto Debian, Fedora a OpenSUSE nainstalujte jej ze správce balíčků.

$ sudo apt nainstalovat gimagereader
$ sudo dnf nainstalovat gimagereader
$ sudo zypper nainstalovat gimagereader

Necítíte se opomenuti, pokud používáte Arch Linux nebo některý z jeho derivátů. AUR vám pomůže. A pokud byste raději přestavěli aplikaci ze zdroje, pokyny jsou v odkazu na její úložiště GitHub na Wiki.

Jsi tím, kdo extrahuje tištěný text z obrázků? Můžete dokonce pořídit snímky vybraných oblastí pomocí telefonu a nahrát je do svého notebooku. Co je ještě cool, je jeho vícejazyčná podpora – která, i když není dokonalá, je již nyní jednou z nejlepších možností v komunitě.

gImageReader patří mezi nejlepší čtečky PDF ve světě open source, zejména díky své schopnosti OCR, takže to vyzkoušejte a uvidíte jak se ti to líbí.

Jako obvykle se s námi můžete podělit o své zkušenosti s aplikací, pokud nějaké máte. A pro přidání dalších návrhů v sekci komentářů níže.