出版品

出版品

基於Ontology之中文文件自動摘要技術之研究

  • 期數:第10卷 / 第2期
  • 全文下載:322.55KB
  • 發布時間:92 年 06 月 30 日
  • 列印
李健興   長榮大學資訊管理學系
陳雅絹   長榮大學資訊管理學系
郭雅琪   長榮大學資訊管理學系
莊宏翊   長榮大學資訊管理學系

  目前一般的文件自動摘要技術,多半以摘錄文章的某一段落或使用統計分析方法,計算句子的權重分數、位置以擷取重要的句子形成摘要,但其摘要內容之正確率、可讀性和整體連貫性卻有其不足之處。本論文建構一中文文件自動摘要系統,以Ontology為基礎架構,並且以「社會犯罪」領域之電子新聞為實驗主體,應用模糊推論 (Fuzzy Inference) 模擬人類之語意思考邏輯,以判斷新聞文件與 Domain Ontology 之間任一詞組 (Term-Pair) 之語意關聯強度。首先,資訊擷取代理人 (RA, Retrieval Agent) 每隔一段固定時間,即自動抓取網路電子報的社會新聞存放於資料庫,同時將文章內容透過文件前置處理代理人 (DPA, Document Pre-processing Agent) 加以斷詞和過濾後,模糊推論代理人 (FIA, Fuzzy Inference Agent) 將自動推論出重要的關鍵詞彙以形成 Dynamic sub-Ontology。再經由摘要代理人 (SA, Summarization Agent) 萃取出能夠表示原始文章內容主題且富含語意之摘要精簡版。除此之外,藉由Web操作介面,讓使用者在短時間內即能快速且有效地獲得符合需求的資訊。

回列表

檢索刊物