本系統目前為測試階段

服務說明

本線上斷詞服務的資料交換方式採用一XML格式,用戶端可自行撰寫程式經由 TCP Socket 連線傳送驗證資訊及文本至本伺服器,伺服器經過處理後經由原連線傳回結果。請詳閱以下說明:

此線上服務為簡介中所提及斷詞系統之簡化版本,僅提供以基本詞典進行斷詞,並且輸出精簡詞類之標記,此系統支援 big5, utf-8, utf-16le 編碼之中文。

申請服務帳號

按此申請

注意事項

  • 本服務預定每天上午六點進行系統維護,每次預計三十分鐘,可能暫時無法提供服務
  • 如需藉此服務架設其他應用程式,或有自行維護斷詞系統的需求,可申請斷詞連線服務的技術移轉(洽詢 中研院智財技轉處 翁嘉煌)
  • 由於斷詞系統是以句為單位處理,因此輸入文章請避免過長的句子造成系統處理上不必要的負擔(合理的句子極少超過80字):文章如果沒有"??!!,;。,."等幫助系統辨識句子的標點符號,則請在應該斷句的地方換行。
  • 文章請盡量輸入真正需要斷詞的句子,尤其當來源是非正式的文體如論壇、聊天紀錄等,最好事先進行過濾也利於節省您分析的時間,以下是不好的例子:
    • 連續攻擊:ex:
      好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊好無聊
      哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈哈
    • 直書當橫書: ex: 簽名檔
      •   萬萬   科 忠南中
      • 動 芳芳  六技 孝京山
      • 物木社醫辛麟張大大復東國
      • 園柵區院亥光犁樓安興路中
    • 無標點符號:ex: 最近看到某家 全球一動 好像有在招募免費測試用戶
    • 表情符號: ex: (/‵⑸′)/~ 薋