- 拿到 work.rar 先解壓縮
- 之後會出現 work 的資料夾
- 使用的概念如下
- 最初的狀態資料庫是零資料
- 匯入 字庫A 和 字庫B
- 其中字庫A是蒐集差異字和破音字
- 字庫B是蒐集可以被忽略的差異字
- 匯入字庫之後資料庫完成初始化
- 進行第二步輸入 txt 檔案然後產生 docx
- 未來字庫有任何更新就直接載入,程式會判斷新舊資料自動忽略舊資料只更新新的字
- 第三個功能 掃描已經存在的docx
- 選擇人工處理過的docx 之後按下確認
- 會比對資料庫,將被認定可以忽略的文字變成水藍色
- 會整理出兩份文件
- 一份是破音字
- 另外一份文件是難字
- 等待人工確認無誤之後新增到字庫A和字庫B中,之後重複匯入字庫AB就可以更新資料庫
此程式為開源工具,使用 Python + PyInstaller 編譯,非病毒。
來源: https://github.com/alarmz/1001
用途: 用於文字轉換及 docx 分析
如有誤報請聯繫:alarmz@gmail.com