- 論壇徽章:
- 0
|
4樓
發(fā)表于 2011-07-26 14:18
NND, 氣憤的解決問題了, 再帖出來, 看看我們的鐵道部是否還會(huì)重現(xiàn)!
html中的一個(gè)table:
<table class="table-list" cellpadding="0" cellspacing="0" border="0">
<tr class="own">
<td class="first"> <a href="xxx.xxx.com" target="_blank"><em>百度</em></a> </td>
<td class="second"><a href="xxx.xxx.com" target="_blank"><em>新聞</em></a></td>
</tr>
<tr class="own stripe">
<td class="first"> <a href="xxx.xxx.com" target="_blank"><em>新浪</em></a> </td>
<td class="second"><a href="xxx.xxx.com" target="_blank"><em>新聞</em></a></td>
</tr>
</table
1. 需要在html中的眾多table中, 找到這個(gè)class="table-list"的table
2. 提取這個(gè)table中的文本及文本對(duì)應(yīng)的連接, 如:
百度: xxx.xxx.com
新聞: xxx.xxx.com
解決思路就是, 先使用handle_data提取這個(gè)table中的文本, 然后設(shè)置一個(gè)標(biāo)志, 再使用start_a提取href, 在start_a中判斷之前的標(biāo)志是否為真, 如果是真, 即可提取. |
|