内頁Banner背景圖
創絡講堂
白(bái)色波浪圖形
灰色波浪圖形 灰色波浪圖形
白(bái)色波浪圖形 白(bái)色波浪圖形
白(bái)色波浪圖形 白(bái)色波浪圖形
白(bái)色波浪圖形 白(bái)色波浪圖形
本文于2012-03-17最後更新,距今已超過1年(nián),如(rú)不符合現在的實際情況,可(kě)聯系創絡客服獲取幫助或查閱近期文章(zhāng)。

可(kě)能大(dà)家在優化自(zì)己網站的時候,還(hái)從(cóng)來(lái)沒有認真分(fēn)析過或者系統的學習過搜索引擎的搜索規則和其中的原理(lǐ)。深圳網絡公司【創絡】通過一些渠道了解到的資料可(kě)能會對大(dà)家展開更高層次的網站優化有一定幫助,如(rú)果您現在正在朝着這樣的方向發展,那麽僅僅知道網站内容和外鏈是遠(yuǎn)遠(yuǎn)不夠的。因此,本文将是技術(shù)角度出發的一些文字,希望能對讀(dú)者有一定的幫助。

搜索引擎之所以可(kě)以在數秒鍾甚至一秒鍾内完成數億級别的數據處理(lǐ),并不是因爲搜索引擎具備多麽強大(dà)的計(jì)算能力,而是全部的網頁都(dōu)是經過預處理(lǐ),爲排名做好了足夠的準備的。網站要有排名,就(jiù)必須被索引,而搜索引擎現在就(jiù)主要是對網站文字進行提取後進行預處理(lǐ),預處理(lǐ)的過程就(jiù)是去(qù)除從(cóng)HTML代碼中抓取的标簽、JS程序等不可(kě)以用來(lái)排名的内容,提取可(kě)以用于排名的頁面文字内容。

其中,中文和英文的索引還(hái)有一個很重要的區别,那就(jiù)是中文會有一個分(fēn)詞技術(shù)。搜索引擎儲存和處理(lǐ)頁面以及用戶搜索都(dōu)是以詞爲基礎的。

分(fēn)詞技術(shù)主要包括兩種,一種是詞典匹配,也就(jiù)是将待分(fēn)析的一段漢字與一個事(shì)先造好的詞典中的詞條進行匹配,如(rú)果發現詞典中已有詞條那麽說(shuō)明匹配成功,就(jiù)分(fēn)出一個關鍵詞來(lái)。

第二種分(fēn)詞技術(shù)是基于統計(jì)的智能方法,也就(jiù)是通過分(fēn)析大(dà)量文字樣本,計(jì)算出字與字相(xiàng)鄰出現的統計(jì)概率,幾個字相(xiàng)鄰出現越多,就(jiù)越可(kě)能成爲一個單詞。這種方法的優勢是對新出現的詞反應更快(kuài)速,有利于消除歧義,詞典匹配和智能匹配這兩種分(fēn)詞技術(shù)通常是互相(xiàng)協調,搭配使用,以提高搜索引擎的精确度。

上一條 返回目錄 下一條
更多閱讀(dú)選擇
相(xiàng)關文章(zhāng)
我們推薦了一些您可(kě)能也會感興趣的文章(zhāng)
客服電話(huà)
  • 0755-23698839
  • 134-1757-3710
  • 132-6576-8769
創絡建站客服二維碼
不出售過期域名
微信咨詢