亚洲av成人无遮挡网站在线观看,少妇性bbb搡bbb爽爽爽,亚洲av日韩精品久久久久久,兔费看少妇性l交大片免费,无码少妇一区二区三区

Chinaunix

標(biāo)題: 菜鳥請教一個關(guān)于python生成json文件的問題~ [打印本頁]

作者: kongjin    時間: 2014-04-23 11:34
標(biāo)題: 菜鳥請教一個關(guān)于python生成json文件的問題~
我現(xiàn)在需要登陸一個鑒權(quán)的網(wǎng)站,然后將服務(wù)器生成的html保存成json文件,然后解析其中的數(shù)據(jù)
鑒權(quán)的代碼如下
username = "xxx"
password = "xxx"
login_url = "xxx"
base_url = "xxx"
body =  (('j_username',username ), ('j_password',password))
cj = cookielib.CookieJar()
opener = urllib2.build_opener(urllib2.HTTPCookieProcessor(cj))
opener.addheaders = [('User-agent',
        'Mozilla/4.0 (compatible; MSIE 6.0; Windows NT 5.1)')]
urllib2.install_opener(opener)
req = urllib2.Request(login_url,urllib.urlencode(body))
try:
    u = urllib2.urlopen(req)
except urllib2.HTTPError as e:
   print e.code

鑒權(quán)通過以后需要抓取服務(wù)器頁面上的數(shù)據(jù):
u = urllib2.urlopen(base_url)
調(diào)用的這個函數(shù)返回的是一個html格式的數(shù)據(jù),現(xiàn)在需要解析其中的數(shù)據(jù),用json.loads(u)無法執(zhí)行 因?yàn)閡的格式不是string類型的,如果保存為json格式的文件然后再解析,用urllib.urlretrieve()這個函數(shù),因?yàn)閡rllib沒有綁定用戶名和密碼 所以只能下載鑒權(quán)的頁面,請教各位大俠如果不下載為json文件,應(yīng)該如何解析u = urllib2.urlopen(req)生成的html或者有沒有其他辦法保存html為json的格式


作者: 修杰_JIANG    時間: 2014-04-23 15:25
本帖最后由 修杰_JIANG 于 2014-04-23 15:34 編輯

urllib2.urlopen 返回一個文件對象吧




作者: qqqqblog    時間: 2014-04-26 16:43
1. 代碼沒用高亮扣分!!
2. “調(diào)用的這個函數(shù)返回的是一個html格式的數(shù)據(jù)”,到底返回啥,敢不敢貼出來,mime type到底寫了啥你造嗎?
3. “json.loads(u)無法執(zhí)行 因?yàn)閡的格式不是string類型的”,轉(zhuǎn)換!
4. “用urllib.urlretrieve()這個函數(shù),因?yàn)閡rllib沒有綁定用戶名和密碼 所以只能下載鑒權(quán)的頁面”,cookie是啥?
5. “應(yīng)該如何解析u = urllib2.urlopen(req)生成的html或者有沒有其他辦法保存html為json的格式”,觀察下返回結(jié)果,自己寫函數(shù)提取之!
6. 推薦python requests庫,業(yè)界出了這么好用的接口,性能算個屁!
7. 負(fù)分!




歡迎光臨 Chinaunix (http://www.72891.cn/) Powered by Discuz! X3.2