淺談 SEO 的概念與方法

相信有在做網頁或是行銷甚至是經營自身品牌等都一定聽過 SEO,那究竟 SEO 是在做什麼以及為什麼需要做 SEO,我希望透過這篇文章能夠用簡單的方式讓你了解 SEO 以及如何應用在你的網站上。

什麼是 SEO

SEO 全名 Search Engine Optimization,直接翻譯就是搜尋引擎的優化,簡單來說就是透過對各個搜尋引擎背後運作的原理來調整自己在網站上的設計,達到提升在搜尋引擎上更多的曝光機會,提高所謂的 搜尋排名

為什麼要提高搜尋排名

因為曝光越多,就代表流量愈多,約有機會實現你的商業模式。

就算你不是為了商業,可能只是想做部落格分享自己,我相信還是多少會希望自己的東西能夠被其他人看到,搜尋到

搜尋引擎的運作方式

在談怎麼提升搜尋排名前,我們需要先了解一個搜尋引擎背後是怎麼運作的
我們可以分成三個階段

  1. 檢索(爬取)
    這個階段指的是搜索引擎如 Google,會利用爬蟲的方法來瀏覽你的網站,並且下載你的網站資料,這個動作就叫做檢索或是爬取,爬取的內容包含,網頁內容,程式碼,圖片等所有網路資訊

  2. 索引(收錄)
    指的是搜尋引擎在下載完(爬)你的網站後,將這些資料收錄建檔到搜尋引擎裡面。
    然而被搜尋引擎收錄並不代表就能提升你的搜尋排名,所以被收錄跟搜尋排名高是兩回事

  3. 曝光在搜尋結果
    搜尋引擎透過使用者的關鍵詞跟自身資料庫的索引來進行搜索,並提供結果給使用者

了解了一個搜尋引擎在搜尋結果中顯示你的網站前所做的事後,我們就可以針對這些階段來做優化

優化概念

索引檢查

可以透過在 Google 搜尋 site:your_website_domain 來檢查你的網頁是否有被收錄到 Google search 裡面

透過搜尋結果也可以檢查你有多少個頁面是有被 Google 搜尋到了

這個檢查相當重要,畢竟如果連搜尋引擎都沒有索引你的網站了,那麼更不用談怎麼優化了

通常只要你的網站有被搜尋引擎健康的「爬取」,收錄就不太會有問題,只要你的網站沒有違規等情況發生的話,很少會有爬取沒問題但是卻不願意收錄你的網站

而要怎麼讓你的網站被爬取跟索引,可以參考 google search console 等關鍵詞,或是未來可能會出一篇教學文章,本篇還是以 SEO 為主

AJAX 瀑布流式網站

這種網站有一種特點,相信大家都滑過 FB 吧,當你只有在往下拉到底的時候,網站才會接著顯示接下來的內容
這種就是所謂的瀑布流網站,只有在特定情況下用 AJAX 來建構網站,但是這種方法對 SEO 就非常不友善了, 畢竟爬蟲是不會有往下滑的這個動作的,因此當爬蟲在爬時,只會爬到最一開始顯示的內容而已

爬取額度 Craw Budget

指的是搜尋引擎對每個網頁都會有一個類似時間限制的東西,每天搜尋引擎都會來看你的網站,而看的時間就取決於你的爬取額度了
例如 Google 每天會來看你的網站 10 分鐘,那麼 10 分鐘過後 Google 就會離開了
因此提高網站的反應速度跟效能能夠有效的提高SEO,畢竟人家10分鐘可能可以看 100 頁,但效能低的可能看個一兩頁時間就到了

主動阻擋

有時候為了提升 SEO 也會適時的阻擋一些頁面,而阻擋的方法有兩種

robots.txt

robots.txt 通常儲存在一個網站的根目錄上,主要是用於阻止搜尋引擎去檢索在 robots.txt 裡面提及的頁面,因為被阻擋檢索了因此也不會被索引

然而大部分情況我們都不會使用 robots.txt 來阻止搜尋引擎檢索我們的網站,除非這個頁面對整體 SEO 是有負面影響的,不然通常情況使用 meta robot 來阻止搜尋引擎控制索引就可以了

robots.txt 的使用方法也很簡單,只要在根目錄上放上 robots.txt 就可以了,以下為 robots.txt 的範例

1
2
3
4
5
6
7
8
9
10
11
12
User-agent: *  
Allow: /
Allow: /archives/
Allow: /categories/
Allow: /about/

Disallow: /vendors/
Disallow: /js/
Disallow: /css/
Disallow: /fonts/
Disallow: /vendors/
Disallow: /fancybox/

檔案會有三個種類來填

  1. User-agent:填入搜索引擎的類別,例如 Google、Bing 等,* 代表允許全部
  2. Allow:允許搜索引擎檢索的頁面,通常是用於你禁止的頁面中又有貼別路徑的頁面想要被檢索的時候
  3. Disallow:禁止檢索的頁面路徑

那什麼時候會希望不要檢索我的網站呢

  1. 未完成的頁面:因為未完成的頁面雖然不會影響到 SEO,但其實對 SEO 也沒什麼幫助
  2. 測試頁面:有些測試頁面可能會跟現有的頁面相同
  3. 網站後台:這也是雖然對 SEO 沒什麼負面影響,但也不會提升 SEO

meta robot

用來阻擋搜尋引擎索引你的網站,但是不會阻擋搜尋引擎檢索你的網站

要使用 meta robot 只需要把他放在你想要阻擋索引的網頁的 head 地下,所以如果有多個頁面要阻擋的就需要在每個頁面都放 meta robot

meta robot 的標籤如下

1
2
3
<head>
<meta name=”robots” content=”noindex , nofollow“>
</head>
  • noindex
    指的是阻擋索引,如果想要允許索引的話就改成 index

  • nofollow
    指的是允不允許搜尋引擎在檢索此頁面時是否要進一步檢索這個頁面所連出去的連結
    通常用於社群論壇等,主要是為了防止有人在頁面上亂貼連結來意圖增加他的 SEO 或是影響你的 SEO

最常使用的是

1
<meta name="robots" contend="noindex, follow">

不要索引我的頁面但是請正常檢索,因為通常有些頁面是你不希望使用者搜尋到的,但是其內容其實有助於提高你的 SEO,例如站內搜尋結果的網頁等

Google Panda

Google Panda 是 Google 內部用來做內容篩選的演算法

關於相關的內容可以回朔到2011年Google員工 Amit Singhal 的文章

其中的核心概念就是 ”我只提供給訪客最優質,最有價值的內容“

一下為我整理出來的幾個大觀念

  1. 關鍵字策略一致
    內容必須要涵蓋並統一整篇文章的關鍵字,例如你的目標關鍵字是餐廳,那麼標題跟內容就必須統一使用餐廳,而不是一下餐廳一下餐館

  2. 以文為主,圖片為輔
    畢竟圖片對演算法來說就只是一串代碼而已

  3. 豐富的內容
    如果字數太少,你的搜尋排名就會被 Panda 排在後面

  4. 可靠的內容
    雖然我不知道 Panda 要怎麼知道你的內容可不可靠,但是不可靠的內容不只對 SEO 沒幫助,還可能會傷害到你的品牌,一個好的辦法是附上參考資料來源

  5. 避免抄寫的內容
    盡量以”獨創“的內容來撰寫,特別的是相同的內容也會影響到 SEO,因為當 Panda 遇到一樣的內容時,為了給予訪客可以搜尋到不同的結果,Panda 會不知道怎麼幫你排名,如果你的測試頁面有跟其他頁面一樣的內容時,可以使用robots.txt來阻擋

結論

以上就是我最近在研究 SEO 時所整理出來的,一開始也是為了提高我部落格的曝光度才研究的,結果發現我的部落格根本沒有被 Google 索引到(寫了2年才發現,有夠好笑),希望這篇文章能對於還不了解 SEO 或是想知道 SEO 的一些改善觀念的人有幫助,當然本篇只是非常簡短的「淺談」SEO 而已,這背後還有很多東西是我還沒談的,例如 Google Analytics 等等。

Reference