一区二区久久-一区二区三区www-一区二区三区久久-一区二区三区久久精品-麻豆国产一区二区在线观看-麻豆国产视频

深入php數(shù)據(jù)采集的詳解

這里介紹兩個php采集能用到的好工具。一個是Snoopy,一個是simple_html_dom。采集還有很多方式(其實本質(zhì)就2-3種,其他的都是衍生的),php自帶了幾個方法也能直接進行采集。但是,出于把懶惰進行到底的精神。我們還是可以通過這兩個工具,讓采集變得更簡單。

網(wǎng)上有不少介紹Snoopy的,下面是別人翻譯的Snoopy的SDK
//////////////////////////////////////////////////////////////
Snoopy是一個php類,用來模擬瀏覽器的功能,可以獲取網(wǎng)頁內(nèi)容,發(fā)送表單。
Snoopy的一些特點:
1抓取網(wǎng)頁的內(nèi)容 fetch
2抓取網(wǎng)頁的文本內(nèi)容 (去除HTML標簽) fetchtext
3抓取網(wǎng)頁的鏈接,表單 fetchlinks fetchform
4支持代理主機
5支持基本的用戶名/密碼驗證
6支持設(shè)置 user_agent, referer(來路), cookies 和 header content(頭文件)
7支持瀏覽器重定向,并能控制重定向深度
8能把網(wǎng)頁中的鏈接擴展成高質(zhì)量的url(默認)
9提交數(shù)據(jù)并且獲取返回值
10支持跟蹤HTML框架
11支持重定向的時候傳遞cookies
要求php4以上就可以了 由于本身是php一個類 無需擴支持 服務(wù)器不支持curl時候的最好選擇,
類方法:
fetch($URI)
――― 主站蜘蛛池模板: 伊人激情久久综合中文字幕 | 在线91色 | 国产精品亚洲高清一区二区 | 午夜激情视频专区在线观看网站大全 | 91精品国产91久久久久 | 好吊妞在线播放 | 精品小视频在线 | 欧美成年黄网站色高清视频 | 久久这里一区二区精品 | 一本色道加勒比海在线 | 国产精品露脸国语对白手机视频 | 国产成人福利免费观看 | 国产精品亚洲一区二区三区 | 一级爱爱片一级毛片-一毛 一级爱做片免费观看久久 一级不卡毛片 | 激情五月深爱五月 | 精品福利 | 美女无遮挡免费视频 | 51短视频版在线观看www免费 | 四虎影视永久免费视频观看 | 韩国免费毛片 | 午夜视频免费在线播放 | 国产精品视频一区二区猎奇 | 四虎4hu永久免费视频大全 | 激情在线小说图片视频区 | 三级毛片网站 | 伊人三区| 久久久午夜精品理论片 | 亚洲成人福利在线 | 久久夜色精品国产亚洲噜噜 | 亚洲精品国产成人专区 | 成人免费看视频 | 黑人干我 | 久久er精品热线免费 | 婷婷综合激情五月中文字幕 | 亚洲综合久久综合激情久久 | 久久综合九色综合狠狠97 | 日韩国产一区二区 | 国产精品午夜在线观看 | 福利在线观看 | 亚洲人成亚洲精品 | 成人福利|