jTessBoxEditor(配套訓(xùn)練工具)
1.5 免費(fèi)版- 軟件大?。?span itemprop="fileSize">4 KB
- 更新日期:2019-02-20
- 軟件語言:英文
- 軟件類別:其它應(yīng)用
- 軟件授權(quán):免費(fèi)軟件
- 軟件官網(wǎng):未知
- 適用平臺(tái):WinXP, Win7, Win8, Win10, WinAll
- 軟件廠商:
軟件介紹人氣軟件相關(guān)文章網(wǎng)友評論下載地址
jTessBoxEditor是一個(gè)Tesseract OCR的Box編輯器,軟件提供簡單的編輯方式,將文字內(nèi)容加載到軟件就可以配置相關(guān)的輸出方案,軟件提供字體設(shè)置功能,可以在軟件編輯當(dāng)前轉(zhuǎn)換的字體類型,也支持兩個(gè)工具,點(diǎn)擊tool就可以找到 Merge TIFF以及Split TIFF工具,方便用戶對添加的tiff文件分割合并;jTessBoxEditor使用簡單,軟件界面功能不多,內(nèi)置多種參數(shù)可以直接使用,需要的朋友可以到河?xùn)|下載!
軟件功能
雙擊JAR文件以啟動(dòng)程序,或執(zhí)行以下命令:
java -Xms128m -Xmx1024m -jar jTessBoxEditor.jar
您需要提供TIFF / Box文件作為編輯器的輸入。在訓(xùn)練中使用的圖像應(yīng)為300 DPI和1 bpp(每像素位數(shù))黑白或8 bpp灰度,未壓縮的TIFF格式; 以UTF-8格式編碼的box文件由具有適當(dāng)命令行選項(xiàng)的Tesseract可執(zhí)行文件生成(請參閱 Tesseract Training Wiki)?;蛘咚鼈兌伎梢允褂脙?nèi)置的TIFF / Box生成器創(chuàng)建。
Box View中提供了以下熱鍵,以便于編輯:
W / S - 向上/向下移動(dòng)盒子; A / D - 左/右移動(dòng)框
Q / E - 減小/增加箱寬; R / F - 減小/增加箱子高度
- 上一個(gè)/下一個(gè)框
X - 在框中編輯字符
使用熱鍵時(shí)按住Shift可將移動(dòng)速度乘以10.編輯字符時(shí)按Enter或ESC可對框編輯器進(jìn)行聚焦。
請注意,框文件中使用的坐標(biāo)系在左下角有(0,0); 但是,在計(jì)算機(jī)圖形設(shè)備上,(0,0)被定義為左上角。jTessBoxEditor使用并顯示在圖形設(shè)備坐標(biāo)中。編輯的盒子文件仍以適當(dāng)?shù)母袷阶x取和寫入。
對于給定輸入U(xiǎn)TF-8文本文件,生成器生成適合使用Tesseract進(jìn)行訓(xùn)練的TIFF / Box文件對。根據(jù)啟用的抗鋸齒模式,生成的圖像是具有300 DPI分辨率的二進(jìn)制或灰度,未壓縮的多頁TIFF??梢哉{(diào)整字母跟蹤或字符間距,以消除邊界框重疊問題。請注意,某些框的坐標(biāo)可能與Tesseract本身生成的坐標(biāo)略有不同(1或2個(gè)像素); 盡管如此,生成的box文件可用于驗(yàn)證Tesseract使用與Unicode兼容的文件比較工具(如 WinMerge)創(chuàng)建的文件。
提示:實(shí)驗(yàn)表明,TIFF / Box Generator創(chuàng)建的圖像訓(xùn)練質(zhì)量較高,字體大小為24pt或更大,并且添加了一些噪音。
用戶可以在UTF-8文本文件中指定符號或變音符號(如在梵文或印度語腳本中找到的符號或變音符號,需要與主要基本字符組合),具體而言data/combiningsymbols.txt,由生成器讀取。此設(shè)置使用戶可以靈活地為其語言腳本定義組合符號/變音符號。
最新版本提供自動(dòng)培訓(xùn)。Tesseract Windows培訓(xùn)可執(zhí)行文件與程序捆綁在一起; 對于其他平臺(tái),您需要 構(gòu)建它們。將所有必需的源訓(xùn)練數(shù)據(jù)文件(以適當(dāng)?shù)恼Z言代碼為前綴)放在指定的目錄中(檢查samples 文件夾中的示例)。還可以使用隨附的train.ps1Windows PowerShell腳本自動(dòng)執(zhí)行培訓(xùn)操作 。
該合并TIFF功能可以節(jié)省用于培訓(xùn)包含相同字體的文本轉(zhuǎn)換成一個(gè)單一的多頁TIFF文件的多張圖片。包含轉(zhuǎn)換函數(shù),用于將字符文本字段中的數(shù)字字符引用(NCR)和轉(zhuǎn)義序列轉(zhuǎn)換為Unicode字符。
軟件特色
- 支持Tesseract 2.0x和3.0x格式的編輯框數(shù)據(jù)
- 實(shí)現(xiàn)框選擇和合并/拆分/插入/刪除操作
- 通過微調(diào)器實(shí)現(xiàn)盒子尺寸更改功能
- 支持文本字段的Unicode轉(zhuǎn)換
- 包括框搜索功能
使用方法
1、下載軟件以后直接打開jTessBoxEditor.jar就可以使用,也可以打開train.bat進(jìn)入軟件主界面
2、用戶需要安裝jdk才能打開jar文件,可以在河?xùn)|下載jdk
3、用戶將下方的軟件安裝到電腦,隨后雙擊jar就可以打開了,選擇 Java(TM) Platform SE binary
大?。?96 MB版本:環(huán)境:WinXP, Win7, Win8, Win10, WinAll
- 進(jìn)入下載
4、軟件主界面就是這樣的,界面是英文,很明顯小編不會(huì)使用
5、在軟件添加Tesseract可執(zhí)行文件,點(diǎn)擊...就可以進(jìn)入添加界面
6、這里是官方提供的程序界面,可以選擇wordlist2dawg.exe,可以選擇wordlist2dawg.exe
7、 Training Data數(shù)據(jù)添加界面,可以選擇vie.words_list、vie.arial.exp0.tif
8、也支持 Bootstrap Language設(shè)置,也支持RTL內(nèi)容設(shè)置,點(diǎn)擊run就可以運(yùn)行
9、也支持 Make Box File Only或者是Train with Existing Box選擇,選擇完畢就可以run
10、執(zhí)行的界面就是這樣的, 如果你會(huì)使用這款軟件就下載吧!
更新日志
版本0.2(2011年4月14日):
- 添加一個(gè)設(shè)置以設(shè)置Box Coordinates表的字體
- 設(shè)置表格行高度以匹配字體
- 將pangram合并到Font對話框中
版本0.3(2011年4月25日):
- 提供當(dāng)前框的特寫視圖
版本0.4(2011年5月28日):
- 添加實(shí)用程序功能,將圖像合并為多頁TIFF
0.5版(2011年9月5日)
- 顯示圖像窗格中已裝箱字符的信息工具提示
版本0.5.1(2011年9月12日)
- 糾正圖像窗格中垂直居中的(小)圖像問題;將其對齊到窗格頂部
版本0.6(2011年10月18日)
- 添加一個(gè)實(shí)用程序功能,創(chuàng)建適合使用Tesseract進(jìn)行訓(xùn)練的TIFF / Box對
- 修復(fù)了在加載其他圖像時(shí)可能清除修改后的文件夾的錯(cuò)誤
- 增強(qiáng)盒子搜索操作
- 修復(fù)各種可視組件中的字體問題
- 合并框?qū)⒕哂杏珊喜⒖虻乃凶址M成的字符值
版本0.7(2012年6月16日)
- 修復(fù)了在OS X上打開幫助文件的問題
- 對于TIFF / Box生成:
*增加行間距
*縮寫粗體/斜體字體樣式到b / i用于文件名
*添加前綴(語言代碼)文本框
*添加對文本消除鋸齒的支持
版本0。0(2013年4月16日)
- 添加行號標(biāo)題
- Char cell現(xiàn)在可以編輯
- 盡可能轉(zhuǎn)換Unicode轉(zhuǎn)義序列
- 查找框現(xiàn)在顯示Unicode字符,并允許使用Unicode轉(zhuǎn)義序列進(jìn)行搜索
- 改進(jìn)生成TIFF / Box功能:
*自動(dòng)組合具有相同坐標(biāo)或完全相互包圍的盒子
*自動(dòng)組合將外部文件中指定的符號與主基本字符組合在一起的框
*在Generate TIFF / Box窗口中保留最后修改的exp編號
版本0.9(2013年4月30日)
- 增強(qiáng)生成TIFF / Box功能,除了附加外,還允許組合前置符號
- 修復(fù)了在編輯模式下無法持續(xù)更改表的錯(cuò)誤
- 查找功能現(xiàn)在支持部分匹配
- 修復(fù)了當(dāng)行標(biāo)題具有焦點(diǎn)和滾動(dòng)時(shí)表格不滾動(dòng)的問題
版本1。0(2013年11月16日)
- 集成對Tesseract培訓(xùn)全自動(dòng)化的支持
- Bundle Tesseract Windows培訓(xùn)可執(zhí)行文件(r866),英文數(shù)據(jù)和配置文件
- 修復(fù)生成的TIFF丟失元數(shù)據(jù)的問題
- 可選擇為生成的圖像添加噪聲
- 錯(cuò)誤修復(fù)和改進(jìn)
1.1版(2014年10月15日)
- 添加從右到左(RTL)文本的培訓(xùn)支持
- 使用修改鍵添加水平框分割
- 添加拆分多頁TIFF功能
1.2版(2014年11月7日)
- 分解培訓(xùn)流程,以實(shí)現(xiàn)靈活的增量培訓(xùn)
- 合并日志記錄
版本1。2。1(2014年11月19日)
- 僅在選擇RTL時(shí)應(yīng)用修復(fù)unicharset的Unicode字符方向性
1.3版(2015年1月4日)
- 實(shí)現(xiàn)功能以驗(yàn)證生成的訓(xùn)練數(shù)據(jù)
1.4版(2015年5月2日)
- 結(jié)合A2K的改進(jìn),在箱子視圖中使用熱鍵進(jìn)行箱子移動(dòng)控制,以及Box View的可調(diào)節(jié)箱子縮放和邊距
1.5版(2016年3月8日)
- 改進(jìn):僅訓(xùn)練帶有文件夾的圖像
- 創(chuàng)建或更新font_properties文件
下載地址
-
jTessBoxEditor(配套訓(xùn)練工具) 1.5 免費(fèi)版
人氣軟件
Adobe Acrobat Pro DC 永久激活版下載548 MB
/簡體中文X-Force KeyGen注冊機(jī)合集(32+64位)658 KB
/英文autocad2017注冊機(jī) 支持32位/64位676 KB
/簡體中文KYTool插件下載(凱元工具)30.54 MB
/簡體中文云南師范大學(xué)上網(wǎng)認(rèn)證客戶端44.8 MB
/簡體中文草圖大師通用注冊機(jī)(sketchup2016激活碼獲取)894 KB
/簡體中文Stata 16(統(tǒng)計(jì)學(xué)軟件)356 MB
/簡體中文refprop(制冷劑物性查詢運(yùn)算軟件)附中文教程6.5 MB
/簡體中文hpds2011下載(城鎮(zhèn)道路路面設(shè)計(jì))1.3 MB
/簡體中文中控zktime考勤軟件系統(tǒng)38.7 MB
/簡體中文
相關(guān)文章
查看所有評論>>網(wǎng)友評論共0條
精彩評論
- 最新評論