最近花了一點時間研究中文斷詞,想要寫一個斷詞用的 PHP extension ,不過對我這個跟 C 不太熟的人來說實在太難了 orz (因此目前 Bigram Full-text Search 只先加上了簡單的停字功能 —— 直接刪除所有停字,不判斷它出現在句子中的什麼位置或者是前後文關係 :p)
先筆記起來,看看以後會不會用到吧…
最近花了一點時間研究中文斷詞,想要寫一個斷詞用的 PHP extension ,不過對我這個跟 C 不太熟的人來說實在太難了 orz (因此目前 Bigram Full-text Search 只先加上了簡單的停字功能 —— 直接刪除所有停字,不判斷它出現在句子中的什麼位置或者是前後文關係 :p)
先筆記起來,看看以後會不會用到吧…