做網(wǎng)站優(yōu)化工作的SEOer都知道,網(wǎng)站的標(biāo)題,關(guān)鍵詞和描述是網(wǎng)站優(yōu)化的基礎(chǔ)。但是如何設(shè)置這些東西,從而符合百度的算法和技術(shù)習(xí)慣并不是一個(gè)簡(jiǎn)單的問題。現(xiàn)在筆者和大家分享一下百度的中文分詞技術(shù),讓大家對(duì)網(wǎng)站優(yōu)化有個(gè)更深入的認(rèn)識(shí)。
所謂中文分詞就是將一些一個(gè)短句分為一個(gè)個(gè)單獨(dú)的詞,或者將一個(gè)短詞分為一個(gè)個(gè)漢字,比如網(wǎng)站seo優(yōu)化,可以是網(wǎng)站seo/優(yōu)化,也可能是網(wǎng)站/seo優(yōu)化,還有可能是被分為網(wǎng)站/seo/優(yōu)化,這就是中文分詞,那么對(duì)于搜索引擎來說有哪些分詞的技術(shù)呢?筆者總結(jié)下來主要分為五點(diǎn)。
首先:用戶改變關(guān)鍵詞習(xí)慣搜索得出的不同結(jié)果,如果在百度里搜索的關(guān)健詞的時(shí)候有加上空格或標(biāo)點(diǎn)其搜索的結(jié)果是不一樣的,比如搜索濟(jì)南SEO和濟(jì)南 SEO,其結(jié)果是有區(qū)別的,這就是因?yàn)槿绻阉魇菨?jì)南seo,那么百度會(huì)根據(jù)自己的數(shù)據(jù)庫分析這是一個(gè)單獨(dú)的詞,但是如果搜索濟(jì)南 seo那么反饋的結(jié)果百度會(huì)認(rèn)為你是需要搜索兩個(gè)詞。
第二:搜索引擎的正向最大匹配法,什么是正向最大匹配,就是將詞從左到右拆分,比如搜索濟(jì)南seo工作室,百度將會(huì)有以下顯示,這個(gè)就是從左到右的正向最大匹配法,會(huì)將濟(jì)南seo 工作室按照兩個(gè)詞拆分。
第三:搜索引擎的反向最大匹配法,通過正向最大匹配,相信大家都了解反向最大匹配了,就是百度會(huì)將詞從右向左拆分,比如搜索濟(jì)南優(yōu)化工作室,百度就會(huì)將濟(jì)南 優(yōu)化工作室作為兩個(gè)詞,這個(gè)拆分是從右向左的。
第四:雙向最大匹配法,對(duì)于有些詞百度會(huì)按照雙向最大匹配法來拆分,比如在搜索濟(jì)南網(wǎng)站優(yōu)化工作室時(shí)我們會(huì)發(fā)現(xiàn)百度將濟(jì)南網(wǎng)站優(yōu)化和網(wǎng)站優(yōu)化工作室都表明了紅色,也就是百度會(huì)將這個(gè)詞按照正反兩個(gè)方面同時(shí)最大匹配了。
第五:最少切分理論,對(duì)于最小切分理論其實(shí)是搜索引擎會(huì)將詞按照最少的切分方式分詞,也就是說如果可以分為兩個(gè)詞那么不會(huì)分成三段的,比如上海SEO工作室,這個(gè)詞百度就將其分為兩個(gè)詞,而沒有分為濟(jì)南 SEO 工作室。
通過以上幾點(diǎn)的分析,相信大家對(duì)于中文分詞都有一個(gè)比較詳細(xì)的了解,筆者建議各位站長盡量通過各個(gè)分詞技術(shù)研究用戶一般會(huì)搜索的關(guān)鍵詞來擬定標(biāo)題的建設(shè)和關(guān)鍵詞的布局。
濟(jì)南網(wǎng)站優(yōu)化:http://m.a9xy4.cn/