Foxtable(狐表)用户栏目专家坐堂 → 网页数据采集问题?


  共有3968人关注过本帖树形打印复制链接

主题:网页数据采集问题?

帅哥哟,离线,有人找我吗?
hjcslr
  1楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
网页数据采集问题?  发帖心情 Post By:2014/5/25 17:45:00 [显示全部帖子]

有个网页数据要采集,试了介绍的好几样方法都不得行,如何采集?
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:临床医生工作平台 ( gd-cwp ).rar






 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  2楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2014/5/26 0:37:00 [显示全部帖子]

正在测试,谢谢

 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  3楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2014/5/26 23:50:00 [显示全部帖子]

测试成功,谢谢了

 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  4楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2015/2/12 23:36:00 [显示全部帖子]

再提一个问题,在下面的网页(服务器的,不是本地的),提取查询结果,可以不?

e.Form.Controls("WebBrowser1").address="M:\临床医生工作平台 ( GD-CWP )333.htm"
Dim drr01 As String = e.Form.Controls("textbox2").text   '用于输入住院号

Dim web As New System.Windows.Forms.WebBrowser()
web.ScriptErrorsSuppressed = True
web.Navigate("M:\临床医生工作平台 ( GD-CWP )333.htm")
Do Until web.ReadyState = 4
    Application.DoEvents
Loop

web.Document.GetElementById("searchFilter.clinicHospitalno").SetAttribute("Value","")  '输入住院号查询
web.Document.GetElementById("searchFilter.clinicHospitalno").SetAttribute("Value","14522")  '输入住院号查询
web.Document.GetElementById("searchFilter.timeFilterType").SetAttribute("Value","不过滤")  '输入住院号查询

Dim hec As System.Windows.Forms.HtmlElementCollection = web.Document.GetElementsByTagName("input")
For i As Integer = 0 To hec.Count-1
    If hec(i).OuterHtml.Contains("查 询") Then
        hec(i).InvokeMember("click")
        web.Navigate("M:\临床医生工作平台 ( GD-CWP )333.htm")
        
'        Exit For
    End If
Next

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:临床医生工作平台 ( gd-cwp )333.rar



[此贴子已经被作者于2015/2/12 23:36:57编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  5楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2015/2/13 13:29:00 [显示全部帖子]

基本可以了,但是这代码要点2次才行,那的问题

 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  6楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2015/2/13 15:42:00 [显示全部帖子]

放在全局变量中可以了?
但是还有个问题,如何偱环打开查询结果网页(查看里面的网页地址)

 回到顶部
帅哥哟,离线,有人找我吗?
hjcslr
  7楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:小狐 帖子:334 积分:2370 威望:0 精华:0 注册:2014/3/15 16:25:00
  发帖心情 Post By:2015/2/13 16:20:00 [显示全部帖子]

网页右面查询内容如何打开(网页地址在查询内容里)
<TD>3</TD>
          <TD>1504201</TD>
          <TD><!-- 
<li style="width:30px;white-space:nowrap;text-overflow:ellipsis;-o-text-overflow:ellipsis;overflow:hidden;" >
&#32993;&#24109;&#36229;
</li>
-->胡席超</TD>
          <TD>男</TD>
          <TD>2015-02-11 11:02</TD>
          <TD>CT室</TD>
          <TD>内一科</TD>
          <TD>宋鑫</TD>
          <TD>住院 </TD>
          <TD>颅脑;颅脑;颅脑;颅脑</TD>
          <TD>张静</TD>
          <TD style="COLOR: rgb(0,160,0)">是</TD>
          <TD><!--target="_blank"--><A 
            href="http://192.168.1.3:8090/cwp/ViewPatientInfoAction!viewPatient.xhtml?id=10120150211853658">查看</A> 
          </TD></TR></TBODY></TABLE></TD></TR></TBODY></TABLE></FORM>

红色部分是我要提取的内容



 回到顶部