Gufonet專區

首頁Gufonet專區即時訊息 〉 Gufonet 1.12版 正式發佈 & 更新常見問題

Gufonet 1.12版 正式發佈 & 更新常見問題

2023.07.21

Gufonet在近期完成1.12版的發佈!本次更新的內容非常豐富,除了就一些已知的錯誤進行修正之外,也在功能及效率上有不少改善,以下列舉其中比較重點的項目,詳細的更新內容說明,請務必參見下方版本通知文件。 

  1. 工具更新:

a. 『Gufonet來源文件管理』主要針對Gufonet.config設定檔異動:

i. 新增crawlerMemory limit模式,用以限制爬蟲索引使用過多記憶體。(設定範例請詳閱使用手冊第66頁)

ii. 設定檔案中AttachedColumnErrorByPass(File Path in DB的檔案不存在時忽略該檔案)參數預設為True;也就是預設的情況下,會忽略檔案不存在的錯誤。


b. 文件匯入程式(IndexUpdate.exe)修正部分Report Exception捕捉方式,同時也修正了匯入檔案檔名消失之問題。

    2. 核心更新 :

a. 增加與回傳文件數量相關之參數:

i. 增加檢索回傳結果參數ExactlyTotalDocNoParam,以控制不回傳精確文件總數時的額外處理工作。
ii. 增加API函數IsTotalDocNoExactly以檢測回傳文件總數是否精確。

b. 新增可取得重要詞彙之API:

i. 增加API函數GetDocImportantTerms以取得文件重要詞彙。
ii. 關聯文件改採用GetDocImportantTerms API取得文件重要詞彙進行主題檢索。

c. 開放對於同義詞組的取得,以及調整同義詞庫的彈性:

i. 增加GetSameMeaningTerm取得指定詞彙的同義詞組API。
ii. 增加AddSystemTerm增加系統詞庫API,以便在不動到現有詞庫前提下,額外加入詞彙。

d. 儲存空間上的改良:

i. 改良並減少文件下載Cache檔的佔用空間(採用NLZ4跨文件整體壓縮,原20.1GB下降至7.2GB,約省下60%空間)。
ii. 儲存機背景進行文件內容最佳化壓縮,以減少索引機、檢索機的文件內容索引檔大小
iii. 回收之可用已刪文件ID,由儲存機改到DocMain,避免已刪文件ID愈放愈多,同時加入遺失文件ID 回收機制。

e. 整體效能的再精進:

i. 文件儲存機改採用批次同步,以大幅加快資料同步的速度(500萬份文件約需20分鐘即可完成同步)。
ii. 檢索機增加檢索檔事先載入機制(SetSearcherPreloadOption API),將部份索引檔先行載入到記憶體中,以加快存取速度。
iii. 索引檔分檔大小由4GB調降至2GB,以方便事先載入。
iv. 實作檢索結果Cache機制(SetSearchCacheTime API),相同之檢索(包括關聯文件)不必重複運算,直接回傳。
v. 文件中心API呼叫時,批次新增文件功能獨立成一個執行緒,以免較長的呼叫時間影響其他功能呼叫的運作。
vi. 調校檢索邏輯運算、模糊查詢、主題查詢、關聯文件、動態摘要、二階排序、詞頻排序、統計運算、分組運算、容錯查詢、回傳最上層文件以及原形詞檢索、非關鍵詞檢索、鄰近檢索的檢索效能。
vii. 調整模糊查詢、主題查詢、關聯文件的取詞方式,以加快運算速度。

 
一併附上更新版的常見問題,若需要進一步了解與協助,歡迎您與我們聯繫! 

*重要提醒:由於資訊安全的限制以及授權管理的議題,Gufonet並不會直接提供更新程式,也不會以遠端自動連線方式進行更新。如有最新版本安裝程式的需求,請務必主動與產品團隊聯繫索取,非常感謝您的配合!


Gufonet企業搜尋引擎 ——

專為華文所設計的文字大數據整合檢索、搜尋與分析探勘引擎,採無詞庫自動斷字抽詞專利技術,在人工智慧(Artificial Intelligence, AI)領域中,針對多資料庫來源、多元格式檔案進行剖析與分類,將所有文檔自動轉化為可以被數據分析的基礎元件,進行字詞關聯、語意聯想、智慧分類等交叉分析,將龐雜資料系統化,以快速獲得正確有價值資訊。