Foxtable(狐表)用户栏目专家坐堂 → 提起网页内容时,http.responseText怎么提取网页源代码的内容。


  共有5805人关注过本帖树形打印复制链接

主题:提起网页内容时,http.responseText怎么提取网页源代码的内容。

帅哥哟,离线,有人找我吗?
xluoping
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:355 积分:3617 威望:0 精华:0 注册:2016/4/2 12:11:00
提起网页内容时,http.responseText怎么提取网页源代码的内容。  发帖心情 Post By:2022/8/25 11:28:00 [只看该作者]

'''
Dim url As String
Dim kehu As String = "惠州市雅新纸业有限公司"
Dim cxw As String = "https://www.qcc.com/web/search?key="
Dim kem As String = "https://www.qcc.com/firm/"
Dim http As Object = CreateObject("MSXML2.XMLHTTP")
http.Open("get", cxw & kehu, False)
http.send()
url = http.responseText
If url.Contains(kem) Then
    url = url.SubString(url.IndexOf(kem))
    url = url.SubString(0,url.IndexOf(""""))
    output.Show(url)
End If

以上并没有提取到网页源代码的内容。实际上谷歌浏览器查看源代码是有 kem 的内容。

 回到顶部
帅哥,在线噢!
有点蓝
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106654 积分:542453 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/8/25 11:29:00 [只看该作者]


 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:355 积分:3617 威望:0 精华:0 注册:2016/4/2 12:11:00
  发帖心情 Post By:2022/8/25 12:33:00 [只看该作者]

参考 中 网页表格数据保存到狐表表中例子.table 这个用开发版 打不开

 回到顶部
帅哥,在线噢!
有点蓝
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106654 积分:542453 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/8/25 13:42:00 [只看该作者]

安装试用版或者商业版即可打开

 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:355 积分:3617 威望:0 精华:0 注册:2016/4/2 12:11:00
  发帖心情 Post By:2022/8/25 13:59:00 [只看该作者]

试用版安装后需要激活
机器码:4607-6210-0728-8287-2763-0000-0000-1763-03

我的电脑上安装了授权的 Foxtable 2019 开发版 

 回到顶部
帅哥,在线噢!
有点蓝
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106654 积分:542453 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/8/25 14:05:00 [只看该作者]

如果过了免费升级期,只能找台新电脑安装试用版了。如果还可以升级,到下载开发版的地方下载商业版安装即可

 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:355 积分:3617 威望:0 精华:0 注册:2016/4/2 12:11:00
  发帖心情 Post By:2022/8/25 14:43:00 [只看该作者]

已按照参考写了代码,并不能获取到 目标内容 https://www.qcc.com/firm/40a5c439681dc375bfbede19bc506d2d.html

Dim web As New System.Windows.Forms.WebBrowser()
web.Navigate("https://www.qcc.com/web/search?key=惠州市雅新纸业有限公司")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop
Dim lis As object = web.Document.GetElementsByTagName("a")
For Each a As object In lis
    Dim hre As String = a.GetAttribute("href")
    If hre.Contains("firm") Then
        output.show(hre)
    End If
Next

以上并没有提取到网页源代码的内容。实际上谷歌浏览器查看源代码是有 https://www.qcc.com/firm/40a5c439681dc375bfbede19bc506d2d.html 的内容。


 回到顶部
帅哥,在线噢!
有点蓝
  8楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106654 积分:542453 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/8/25 14:52:00 [只看该作者]

这个我也不懂,要自己去分析别人页面的逻辑了。

 回到顶部
帅哥哟,离线,有人找我吗?
xluoping
  9楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:355 积分:3617 威望:0 精华:0 注册:2016/4/2 12:11:00
  发帖心情 Post By:2022/8/25 16:06:00 [只看该作者]

Dim web As New System.Windows.Forms.WebBrowser()

要提取的是JS生成的内容,但是WebBrowser() 会提示错误,读不到JS生成的内容。

 回到顶部
帅哥,在线噢!
有点蓝
  10楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106654 积分:542453 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2022/8/25 16:10:00 [只看该作者]

试试升级一下ie内核:http://www.foxtable.com/bbs/dispbbs.asp?boardid=2&id=99436

如果这个网站不再支持ie的话,就没有办法了

 回到顶部
总数 11 1 2 下一页