之前看到各大搜索引擎的原始識別和權重繼承算法分析這個文案,寫的不錯,但是一般學生不太容易理解,有些算法就不提了。
對于原始識別,可以提取原文中提到的關鍵詞,然后使用md5或頻率目標法,但實際應用可能不是很有效。在各大搜索引擎對原文的識別中,根據關鍵詞詞頻(tf)的比較,有一些低級,也就是說文本太多,容易誤判。因此,需要另一個指標來評價。這個方法是切片比較。按照固定的步長對文本進行切片,比較其相似度,會更接近真實結果。切片比較可以很好地識別段落混亂的偽原始方法。
頁面降噪技術被各大搜索引擎廣泛采用。對于大部分標題+文本的文本,可以利用降噪技術獲得接近真實文本的文本。然后在seo中,需要在文本中間加入干擾因素,打斷各大搜索引擎的推廣和切片。添加的文本可以使錨文本鏈接,也可以使段落關聯。而且這種方法還會打亂各大搜索引擎的矢量化解決方案。
原文中也提出了站內權重繼承的問題。站內頁面權重繼承沒有原作者說的那么簡單,權重分布也不是簡單的平均分布。而且為了防止網站在短時間內大量制造內鏈來提高自身的權重,在網站中權重傳播的過程中加入了阻尼基,通常為0.15。也就是說,如果一個頁面有一百個導出鏈接,其中15個不會參與權重傳播。根據鏈接出現的位置,鏈接在每個位置得到的權重繼承是不同的;根據鏈接使用的標簽不同,每個鏈接得到的權重繼承也不同;根據關聯程度的不同,每個環節得到的權重繼承是不同的。這里補充的是,由于去噪或抑制基數,某些位置的鏈接可能會被優先消除。
權重繼承算法是一個復雜的公式,類似于谷歌pr公式。原文還提到了一個對漢語語法的應用。其實各大搜索引擎并不太關注中文語法,只需要找出stopword,這里的stopword可以是任意詞性,也可以是任意語法單位。各大搜索引擎都把抽取的詞當做名詞,而偏向于褒義詞。因為客戶的搜索動作是中性的,不會給搜索關鍵詞賦予感情色彩。也許以后會有情感搜索引擎,讓你選擇搜索時的情感狀態,返回不同的結果,但現在看來,有點理想化。
雖然各大搜索引擎不區分詞性,但是區分了。因為語氣可以評價客戶的需求。當你搜索糖果的時候,各大搜索引擎都無法評價你是在找好吃的糖果,還是一個企業品牌,還是糖果的功能。但是當你搜索糖果的時候,各大搜索引擎都能評價出你的需求非常旺盛。也許你在尋找最好的糖果,也許是最貴的糖果,或者是最丑的糖果,等等。
這里很難理解,因為“最好吃的糖果”這個詞包含了形容詞“好吃”,但是我前面說過,各大搜索引擎不區分詞性,只區分語氣。在這里,“最”代表的是語氣,“好吃”只是作為名詞對待。可以百度“好糖果”和“好糖果”。看看百度的結果就能發現這個問題。排名靠前的標題通常是帶有疑問或強調語氣的標題。
標題:[新聞營銷]SEO原創識別具體應用與站內權重繼承算
地址:http://m.galaxydg.com.cn/xinwen/25918.html
免責聲明:文芳閣軟文營銷平臺所轉載內容均來自于網絡,不為其真實性負責,只為傳播網絡信息為目的,如有異議請及時聯系[email protected],本人將予以刪除。