Foxtable(狐表)用户栏目专家坐堂 → 读取网页数据


  共有4369人关注过本帖树形打印复制链接

主题:读取网页数据

帅哥哟,离线,有人找我吗?
dixiaxiaodan
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:234 积分:2062 威望:0 精华:0 注册:2015/11/7 21:11:00
读取网页数据  发帖心情 Post By:2019/3/9 15:30:00 [只看该作者]

我想要将网址:http://www.caacaad.org.cn/index.php?a=2&t=1的数据读取出来,但其中每个适航指令的发布日期并未在网页的表格里,而是在链接的pdf里,这种有办法读出来吗?

已经写好的代码如下,缺少读取pdf中发布日期的代码,求大神相助,谢谢。
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:网页数据读取--ad.table


[此贴子已经被作者于2019/3/9 15:30:51编辑过]

 回到顶部
帅哥,在线噢!
有点蓝
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106081 积分:539504 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2019/3/9 16:00:00 [只看该作者]


 回到顶部
帅哥哟,离线,有人找我吗?
dixiaxiaodan
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:234 积分:2062 威望:0 精华:0 注册:2015/11/7 21:11:00
  发帖心情 Post By:2019/3/9 16:46:00 [只看该作者]

有点蓝老师,我的意思是
图片点击可在新窗口打开查看此主题相关图片如下:捕获.png
图片点击可在新窗口打开查看
每个文件的发布日期在标题栏链接的那个pdf里,这种有办法读取出来吗

 回到顶部
帅哥,在线噢!
有点蓝
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106081 积分:539504 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2019/3/9 17:05:00 [只看该作者]

这种是后台处理请求的,获取不了

 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/3/10 10:58:00 [只看该作者]


 回到顶部
帅哥哟,离线,有人找我吗?
dixiaxiaodan
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:234 积分:2062 威望:0 精华:0 注册:2015/11/7 21:11:00
  发帖心情 Post By:2019/3/11 23:25:00 [只看该作者]

嗯嗯,谢谢各位老师,现在又有一个新的问题,我想把读取出来的数据中不符合要求的自动删掉,例如指令编号如果不包含A320,那么删除此行,我现在的代码如下,但就是删除行的操作报错。(因为指令编号字符数不定,感觉like无法满足要求)
Dim web As New System.Windows.Forms.WebBrowser()
Dim Cols() As String = { "指令编号","修正案号","标题","生效日期", "获取日期" }

For pg As Integer = e.Form.Controls("textbox1").Value To e.Form.Controls("textbox2").Value
'Dim pg As Integer = 1
    Dim wz As String = "http://www.caacaad.org.cn/index.php?a=2&t=1&page= "& pg & "&"
    web.Navigate( wz )
    Do Until web.ReadyState = 4
        Application.DoEvents
    Loop

    Dim elems As object = web.Document.GetElementById("table1").GetElementsByTagName("tr")
    Dim m As Integer = 0
    Dim r As Integer = 0
    For Each elem As object In elems
        r = r + 1
        If r = elems.count Then
            Exit For
        End If
        Dim i As Integer = -1
        m = m + 1
        Dim tdelems As object =  elem.GetElementsByTagName("td")
        If m > 1 Then  '因为网页的表格有标题,如果不判断,就会增加出一个空行
                Tables("AD").AddNew
        End If
        For Each tdelem As object In tdelems
            i = i+1
            If i < 3 Then
                Tables("AD").Current(Cols(i)) = tdelems(i).Innertext
            ElseIf i = 3 Then
                Tables("AD").Current(Cols(i)) = tdelems(5).Innertext                            
            ElseIf i = 4 Then
                Tables("AD").Current(Cols(i)) = Date.Today
                Exit For
            End If            
        Next
        With Tables("AD")
            If Tables("AD").Current(Cols(0)) Like "???####A320" Then
            Else
              .Current.Delete()
            End If
        End With
    Next 
Next
Tables("AD").save
'

 回到顶部
帅哥哟,离线,有人找我吗?
dixiaxiaodan
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:234 积分:2062 威望:0 精华:0 注册:2015/11/7 21:11:00
  发帖心情 Post By:2019/3/11 23:27:00 [只看该作者]

而且,因为涉及下载pdf,我想先做判断,再取数据。例如 如果适航指令编号列包含A320,那么下载附件(下载数据这块我先自行研究,不麻烦老师们呢),读取数据,这样可以避免取数后再删除的操作。

 回到顶部
帅哥哟,离线,有人找我吗?
有点甜
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:版主 帖子:85326 积分:427815 威望:0 精华:5 注册:2012/10/18 22:13:00
  发帖心情 Post By:2019/3/12 9:31:00 [只看该作者]

这个意思?

 

If Tables("AD").Current(Cols(0)) Like "*A320" Then

 

 


 回到顶部
帅哥哟,离线,有人找我吗?
dixiaxiaodan
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:童狐 帖子:234 积分:2062 威望:0 精华:0 注册:2015/11/7 21:11:00
  发帖心情 Post By:2019/3/12 20:56:00 [只看该作者]

是的,是这个意思,但这样写不行,程序会报错。

 回到顶部
帅哥,在线噢!
有点蓝
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106081 积分:539504 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2019/3/12 21:36:00 [只看该作者]

什么错?

 回到顶部
总数 23 1 2 3 下一页