亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

  免費(fèi)注冊 查看新帖 |

Chinaunix

  平臺(tái) 論壇 博客 文庫
最近訪問板塊 發(fā)新帖
查看: 3660 | 回復(fù): 3
打印 上一主題 下一主題

[游戲娛樂] shell 爬蟲 [復(fù)制鏈接]

論壇徽章:
0
跳轉(zhuǎn)到指定樓層
1 [收藏(0)] [報(bào)告]
發(fā)表于 2016-01-06 14:01 |只看該作者 |倒序?yàn)g覽
爬糗事一個(gè)小程序 很簡答
昨天開始在看py 爬蟲
但是tm 的 看不懂。
例子運(yùn)行也失敗了
想了想 用shell 寫了個(gè)入門的
  1. #!/bin/bash
  2. page=1

  3. function get_html(){

  4.    curl -A "Mozilla/4.0 £šcompatible£» MSIE 6.0£» Windows NT 5.0£©" qiushibaike/8hr/page/$page>fun

  5.     echo "This is page$1"

  6.     sed -n '/<div class="content">/,/<\/div>/p' fun|sed 's/^<.*//g' |sed '/^ *$/d'>f
  7.     read_by_line

  8.     let page=$1+1

  9.     have_fun $page

  10. }



  11. function have_fun()

  12. {

  13. for i in `seq 10`

  14. do
  15.    

  16.     Input_user=n

  17.     i=$page

  18.     Input_user=0

  19.     if [ $i -eq 1 ]

  20.     then

  21.         echo "have fun"

  22.         get_html $i

  23.     else

  24.         echo "Continue? [y|N]"

  25.         read Input_user

  26.     fi



  27.     if [[ $Input_user == N ]]

  28.     then

  29.         exit

  30.     else

  31.         get_html $i

  32.     fi

  33. done       

  34. }


  35. function read_by_line()
  36. {   
  37.     clear
  38.     while read line
  39.     do
  40.         echo
  41.         echo $line |sed 's/<br\/>/\n/g'
  42.         echo
  43.         echo "Continue [y|N]"

  44.         read Input_user</dev/tty
  45.         if [[ $Input_user == N ]]
  46.         then
  47.             exit
  48.         fi
  49.     done <f
  50. }


  51. have_fun

  52. rm -rf f fun
復(fù)制代碼

論壇徽章:
0
2 [報(bào)告]
發(fā)表于 2016-01-06 14:02 |只看該作者
把網(wǎng)址改一下就好了

論壇徽章:
2
15-16賽季CBA聯(lián)賽之北控
日期:2016-01-19 15:19:55程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-01-25 06:20:00
3 [報(bào)告]
發(fā)表于 2016-01-19 15:02 |只看該作者
學(xué)習(xí)了回復(fù) 2# Piaomiao139


   

論壇徽章:
6
程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-01-15 06:20:00操作系統(tǒng)版塊每日發(fā)帖之星
日期:2016-01-16 06:20:00IT運(yùn)維版塊每日發(fā)帖之星
日期:2016-02-04 06:20:00數(shù)據(jù)庫技術(shù)版塊每日發(fā)帖之星
日期:2016-02-04 06:20:00程序設(shè)計(jì)版塊每日發(fā)帖之星
日期:2016-02-10 06:20:01每日論壇發(fā)貼之星
日期:2016-02-10 06:20:01
4 [報(bào)告]
發(fā)表于 2016-01-19 22:55 |只看該作者
用curl和sed提取頁面還特別巧,贊一個(gè)
您需要登錄后才可以回帖 登錄 | 注冊

本版積分規(guī)則 發(fā)表回復(fù)

  

北京盛拓優(yōu)訊信息技術(shù)有限公司. 版權(quán)所有 京ICP備16024965號(hào)-6 北京市公安局海淀分局網(wǎng)監(jiān)中心備案編號(hào):11010802020122 niuxiaotong@pcpop.com 17352615567
未成年舉報(bào)專區(qū)
中國互聯(lián)網(wǎng)協(xié)會(huì)會(huì)員  聯(lián)系我們:huangweiwei@itpub.net
感謝所有關(guān)心和支持過ChinaUnix的朋友們 轉(zhuǎn)載本站內(nèi)容請注明原作者名及出處

清除 Cookies - ChinaUnix - Archiver - WAP - TOP