2012年5月22日 星期二

從數字的歷史來看網站經營, 網點: 網站完全評點

沒有足夠資訊所做的判斷, 只是又再次增加錯誤的決策罷了.... 

楊威利, 前十三艦隊軍團長

我們都知道要看一個網站經營, 最直接的就是看使用量或業績/利潤, 但這些只是最後的結果, 要知道如何改善, 還是須要很多細節去發現如何做, 網點就是因為這樣做出來的網站.

這網站原本預計是在 4/1 公開的, 但一拖就拖過馬總統還是就職過後, 只是到現在這個網站還是沒有美化, 但至少有一個 Visualization 視覺化的圖表後, 就匆忙公開了....

在之前很多人知道這網站是從 Data Mining 資料探勘的角度來看 Search Engine Optimization (SEO) 的這個企劃, 但想想我個人實際上跟本不喜歡 SEO 這東西, 而再做一個 SEO 網站不是很好笑嗎? 所以窮則變, 變則通, 最後 SEO 變成 Site Examination Over, 也就是網站完全評點, 簡稱 "網點", 這樣就不會太無趣了吧...

但從 2 月底做到現在, 資料都搜集快三個月了, 很多資料量的確大到可以視覺化了, 其中最重要的就是這網站真正的初衷: "幫網站做成長的歷史".

以我偏頗角度的思維來看, 觀察數字須要做到幾點:

1. 自動化: 能夠不透過人的方式主動, 客觀的抓到資料.
2. 即時性: 隨時盡量呈現最新的資料.
3. 歷史: 從時間軸知道事情的變化.
4. 標準化/指數化: 無論是 Normalization 或 Indexing, 降冪達到一個可以比較的基準.
5. 大量資料: 要有足夠的 Entropy (熵) 才能夠獲得有用的結果.

但上面者五點, 很多人都有做到, 但很多人都會忽略一點, 且也最麻煩的是 "歷史", 畢竟很多人在處理資料的時候, 都沒有考慮到時間序列 (Time Series) 的資料處理方式, 就像是我常以網路管理角度的出發來舉例: "CPU 負荷 80% 不算高, CPU 負荷 5% 不算低, 因為要跟之前做比較".

網點站抓的資料相當大量, 有從關鍵字角度出發, 也有從網站角度出發, 上次有說到從關鍵字在各個社群網站的表現來推估使用者在 SNS 內容產出量的比例, 這就是一種二次資料的應用, 而這次也從 Google/Bing/Yahoo 等搜尋引擎來看網站的表現, 雖然也是種二次資料, 也就是絕對沒有網站真正經營者資料來得更完整, 但我知道大部份的網站經營者都沒考慮 "時間" 與 "比較".

因此網點就以這兩個角度做出發, 幫大家從 Search Engine 的觀點來看自己網站的成長史, 以及跟他人做比較, 只是現在寫出來的是成長史, 比較部份可能要晚一點完成.

下圖就是這個部落格 (黑貘來說) 的成長歷史圖表:



這歷史有兩部份, 一部份是網頁收錄數, 以及最新的外部連結, 這兩部份無論對內容經營者, 或社群行銷者都是很重要的資訊, 雖然這些資料沒有每天的 Log Analysis 準確, 但又的確是可以反應出一種經營成果的 KPI.

當然這系統是開放的, 也就是說大家都可以自己輸入自己查, 但像外部連結收錄史這比較會花資源的, 可能就是以 Coffee Service 的方式來運作, 只是比較討厭的事是像這樣漂亮的圖表, 可能須要輸入後過幾個星期才會比較好看, 也就是當已經抓了上千筆資料後, 在 Presentation/Visualization 呈現與視覺才有足夠的 "空間" 來美化, 相較資料不夠還畫不出甚麼有意義的圖表.

這邊的外部連結是以 Google Crawler 呈現在 Search Engine Result Pages 為主, 若你自己去看 Webmaster Tools 數字一定會比這邊多, 且更有時效性, 但通常這邊的資料往往也是最會直接影響 SERP, 所以相當重要, 因為外部連結是社群行銷經營最有義的成果. 再過幾天, 也會針對這部份做分析, 包含以網站為單位的分析都有可能.

網站經營的層面真的太多, 我之前還寫過網站經營的 13 層面, 比 ISO 的 OSI 七層還要多, 這也表示經營網站要看的資訊真的很多, 只是要如何系統化的去了解, 這個評點只是眾多工具的一個, 但也是蠻重要的一個.

Anyway, 若大家有興去, 就去 網點: 網站完全評點 看看吧..

1 則留言:

  1. 很棒的想法,可以建立評估網站的標準和系統,這是相當重要的基礎工具,謝謝辛苦了

    回覆刪除

熱門文章