網站靜態頁面生成及網站數據采集的攻防 - 網頁設計

http://webdesign.zoapcon.com

  本著互聯網共享主義精神,特寫此文獻給建站新手,授人以魚,不如授人以漁,本文所講的只是方法和原理,希望大家看完此文,能夠從中得到些幫助和啟發。

  本文從一個ASP程序員的角度用大量實例祥細介紹了動態網站如何生成靜態頁面原理,又從一個采集程序開發者的角度去祥細介紹了網站數據采集的原理及功防策略。

  關于網站生成靜態頁面,為了讓本文讀者容易理解,文內列舉了目前常用的多種生成靜態頁面的方法,其中用了很多的實例代碼進行說明。

  關于網站數據采集攻防,作者本身是一個采集程序的開發者,同時作者也收集研究了多種采集程序,列舉了目前國內比較流行的幾種防采集策略,并對每種策略作了簡單客觀的分析評價,希望能給廣大站長們提供一些幫助。此章節也把作者原創的防采集方法奉獻給大家,目地是為了讓大家了解,防采集,不防搜索引擎,是可行的,有效的。

  聲明:希望各位朋友轉載時,不要把原有作者版權去掉,謝謝合作。

  由于本人寫作水平有限,寫的不好的地方,還請大家多多包涵,如要批評或意見,請加我QQ。

  目前很多人都開始注重動態頁面生成HTML頁了,但選擇哪種生成HTML的方法和防采集卻不防搜索引擎的問題卻經常困擾大家。解決此問題則是本文產生的原因。

  首先祥細說一下常用的幾種生成HTML的方法:

  生成HTML方法主要步驟只有兩個:

  一、獲取要生成的html文件的內容

  二、將獲取的html文件內容保存為html文件

  我在這里主要說明的只是第一步:如何獲取要生成的html文件的內容:

  目前常用獲取html文件的內容的方法有幾下幾種:

  1、str="<html標記>內容</html標記>"

  str=str&"內容數據庫讀取內容........."

  這種方法與是在腳本內寫要生成的html內容,不太方便預覽生成頁面的內容,無法可視化布局頁面,更改html模板時會更加復雜。

  用這種方法的人很多,但我感覺這種方法是最不方便的。

  2、制作單獨的HTML模板頁,動態的內容用特定的字符作為標記(如:有人用$title$標記為網頁標題),用ADODB.Stream或者Scripting.FileSystemObject將其模板內容載入,然后再用替換方法把原先定好的標記替換為動態內容(如:Replace(載入的模板內容,"$title$",rs("title" ) ) )。

  3、用XMLHTTP或serverXMLHTTP獲取動態頁所顯示的HTML內容。


arrow
arrow
    文章標籤
    網頁設計 web design
    全站熱搜

    inspirr 發表在 痞客邦 留言(0) 人氣()