中文分詞是互聯(lián)網(wǎng)應(yīng)用不可缺少的基礎(chǔ)技術(shù)之一,也是其他語(yǔ)音和語(yǔ)言產(chǎn)品必不可少的技術(shù)組件。
經(jīng)過(guò)連續(xù)多屆國(guó)際中文分詞評(píng)測(cè),由字構(gòu)詞的分詞方法獲得了壓倒性優(yōu)勢(shì),極速分詞采用由字構(gòu)詞技術(shù)路線,同時(shí)優(yōu)化了分詞速度,使得極速分詞引擎具備了分詞速度快和分詞精度高的雙重優(yōu)勢(shì)。
免費(fèi)版性能指標(biāo)
分詞速度:350萬(wàn)字每秒,該速度遠(yuǎn)遠(yuǎn)超過(guò)目前利用模型(如馬爾科夫模型)進(jìn)行分詞的速度
分詞精度:免費(fèi)版僅僅使用200萬(wàn)字語(yǔ)料訓(xùn)練分詞知識(shí)庫(kù),分詞精度在95%左右,測(cè)試表明在保持速度的同時(shí),可以通過(guò)增加訓(xùn)練語(yǔ)料規(guī)模,將性能提高到97%以上
測(cè)試環(huán)境:Intel 3GHZ CPU & 2G 內(nèi)存
當(dāng)前免費(fèi)版僅僅包含基本分詞功能,后續(xù)將繼續(xù)推出免費(fèi)的詞性標(biāo)注、關(guān)鍵詞識(shí)別、新詞識(shí)別;同時(shí)支持用戶詞典,任何問(wèn)題和建議,可通過(guò)如下方式與作者聯(lián)系


















您的評(píng)論需要經(jīng)過(guò)審核才能顯示
有用
有用
有用