2012年6月8日 星期五

網點: inanchor 與 inurl 對 SEO 的效用為何?

在開始寫這篇之前, 先弄個小 box 讓大家回顧之前有關 網站完全評點 (原SEO鑑價系統) 的文章:

對黑帽 SEO 的回應 (SEO 鑑價系統的初探 I)
內容關鍵字的數量與比例 (SEO 鑑價系統的初探 II)
你找的 SEO 公司真的有成效嗎? (SEO 鑑價系統的初探 III)
從部落格觀察的失敗來看 Crawler 的設計 (SEO 鑑價系統的初探 IV)
SEO 評價的四面相 (SEO 鑑價系統的初探 V)

除此之外, 也寫過兩篇文章:

從關鍵字使用量看社群使用量, 台灣對臉書的依賴過高?
從數字的歷史來看網站經營, 網點: 網站完全評點

這幾篇文章可以說是我對 SEO 中的稽核部份的數字觀點的小結與再出發, 而說到再出發也包含了一些新的實驗與實作, 其中最近做了一個相當有趣的實驗, 就是利用 Google 的搜尋結果來做 "語意網路" 的延伸, 這是相當有趣的, 例如


觀光這個字來計算, 可以算出下面兩種面向的延伸:
延伸關鍵字 : 觀光巴士 糖廠 旅遊網 黃健庭 旅遊資訊 王乾發 旅遊 酒廠 李朝卿 台灣旅遊  
被關連 : 公車 旅遊網 糖廠 旅遊資訊 交通 軍人

而用馬英九來計算, 結果是: 
延伸關鍵字 : 總統 胡志強 黃敏惠 陳水扁 王乾發 蘇貞昌 總統府 謝長廷 傅崐萁 證所稅  
被關連 : 瘦肉精 蘇貞昌 林書豪 國民黨 陳水扁 總統府 證所稅 總統

大家有興趣可以自己點進去看, 例如 瘦肉精 可以延伸出甚麼?

這就是一個有趣的 Data Mining/Text Mining (文字探勘) 的小實驗, 以這系統自己本身已有的關鍵字資料來做延展, 這對幫助使用者操作, 提高內部連結, 加強關鍵字強度, 增加內容性等等都很有幫助, 這也是我在很多公開場合講過但還沒寫出來過的不算密技的密技, 因為這個是大家都知道, 但實作出來卻須要很多背景知識與經驗.

上面這個本該是獨立出一篇文章, 但可以寫的東西太多, 反而沒有時間完成, 在這邊就小提一下, 但在這次的實驗中, 是增加 inanchor 與 inurl 的觀察.

我在有次回答 ET Blue 有關 SEO 的時候, 有說到一點 SEO 重要依序:
 

1. 網域名 Domain Name
2. URL
3. 標題 Title
4. Head 的 Tag
5. 其他 Logical Tag 
6. Alt, Desc 等符合 "無障礙" 的 Tag
.....
N. 關鍵字密度 Keyword Density
.....
M+N. Meta Data
....


這篇內容寫在 最重要但也最沒用的 SEO 心法裏面, 大家可以去看, 只是網點站好像沒有針對 URL 下去做, 尤其是在外部連結的 "錨定文字" 下工夫, 雖然這些在 Google 上面都有資料, 但這也是最麻煩的.

記得有一次老貓問到我說, 為甚麼 Google 能夠在這麼短的時間內算出這個字有出現 12600000 次, 這是多可怕的計算量阿! 但我回答說, 事實上這是個推估, 因此只有 3 個有效位數, 並不是真的去從頭到尾算一次.

但也因為是推估的關係, 所以常常會有數字相當大的跳動, 這跳動不是只有 10%~30% 的跳動, 而是數十倍到百倍的跳動, 例如右表就是逐日去取樣 Google 對 SEO 這關鍵字的推估數字, 而 Google 已經是這樣子了, Bing 更是慘不忍睹阿... 所以說, 在資料探勘中, 要面對的一個大挑戰不是 Crawling 抓取而已, 而是這種二次資料, 須要很大的工夫去做 Data Cleaning and Correcting, 資料乾淨與正確化, 這部份我花了一個月才弄出好的演算法來畫出上次大家看到的網站成長圖, 不然會是個到處跳動的轉折無法判斷的圖.

而 inanchor 與 inurl 為甚麼之前都沒有在計算, 因為這個誤差跟跳動比連結更可怕, 畢竟在這種 Big Data 的資料處理大多是有用 Cache 快取的機制, 若是很少人會查詢或第一次查詢時誤差會相當的大, 相對的若是常用的話就會比較準確, 而這部份的 Data Cleaning 是比可怕還要可怕.

而外部連結與錨定文字之重要性不說大家也知道, 在 Webmaster Tools 中, 不只是對 Crawler 抓到的內容做分析, 其中也把外部連結之錨定文字也列出一個章節, 只是外部連結的錨定文字我們無法去改變, 但網站內部的錨定文字總是可以下工夫努力的吧?

只是這部份 Webmaster Tools 也是沒有 History 歷史分析與成長, 幸好有 "網點" 站, 所以現在可以放心大膽的去來抓資料要驗證計算, 以及幫忙作歷史, 畢竟在做 SEO 的人知道內容是王道, 外部連結是女王, 而網址是無法動搖的基礎, 而我們來檢驗外部連結的 "錨定文字" 吧.

所以, 等過幾個星期累積到足夠的資料我們再來好好評點吧.

備註: 錨定文字指的是 HTML Tag 中 <a href=網址>文字</a> 中的文字, 因為 a 是 Anchor, 所以稱為錨定文字或錨文字.

沒有留言:

張貼留言

熱門文章