gImageReader je bezplatná čtečka PDF s otevřeným zdrojovým kódem se schopností extrahovat text z obrázků a souborů PDF. Je vytvořen jako jednoduchý Gtk/Qt front-end pro Tesseract-OCR, open-source OCR engine pro rozpoznávání textů a vzorů v dokumentech a obrázcích pomocíUmělá inteligence
Sám o sobě je Tesseract nástroj příkazového řádku, který je omezen na použití uživateli Linuxu, kteří jsou dostatečně obeznámeni s jejich terminály. Díky gImageReader nyní může každý využít efektivitu OCR motoru.
gImageReader funguje tak, že skenuje texty z PDF nebo obrázkového souboru v některém z několika jazyků, které podporuje díky existenci znaků Unicode . Obsahuje jednoduché, dobře organizované přizpůsobitelné uživatelské rozhraní, jehož prostřednictvím můžete provádět kontrolu pravopisu a překladatelské úkoly.
Funkce v gImageReader
gImageReader se snadno používá a podporuje práci s dokumenty v elektronické podobě a také se snímky nahraných médií, např. snímky obrazovky. Máte dokonce možnost vybrat oblast textu, která vás zajímá, a přidat pouze text, který potřebujete. gImagereader funguje jako čtečka PDF i jako nástroj pro extrakci textu. Blbé věci.
Nainstalovat gImageReader v systému Linux
Abyste mohli gImageReader využívat naplno, musíte ručně nainstalovat Tesseract jazykové balíčky, abyste mohli správně analyzovat obrázky a soubory.Balíček se nazývá 'Tesseract-ocr-eng' a je k dispozici u správce softwaru v Debiana Fedora distribuce.
Pokud používáte Ubuntu, můžete jednoduše přidat PPAa spusťte instalační příkaz pomocí následujících příkazů:
$ sudo add-apt-repository ppa:sandromani/gimagereader $ aktualizace sudo apt $ sudo apt nainstalovat gimagereader
Zapnuto Debian, Fedora a OpenSUSE nainstalujte jej ze správce balíčků.
$ sudo apt nainstalovat gimagereader $ sudo dnf nainstalovat gimagereader $ sudo zypper nainstalovat gimagereader
Necítíte se opomenuti, pokud používáte Arch Linux nebo některý z jeho derivátů. AUR vám pomůže. A pokud byste raději přestavěli aplikaci ze zdroje, pokyny jsou v odkazu na její úložiště GitHub na Wiki.
Jsi tím, kdo extrahuje tištěný text z obrázků? Můžete dokonce pořídit snímky vybraných oblastí pomocí telefonu a nahrát je do svého notebooku. Co je ještě cool, je jeho vícejazyčná podpora – která, i když není dokonalá, je již nyní jednou z nejlepších možností v komunitě.
gImageReader patří mezi nejlepší čtečky PDF ve světě open source, zejména díky své schopnosti OCR, takže to vyzkoušejte a uvidíte jak se ti to líbí.
Jako obvykle se s námi můžete podělit o své zkušenosti s aplikací, pokud nějaké máte. A pro přidání dalších návrhů v sekci komentářů níže.