Foxtable(狐表)用户栏目专家坐堂 → 关于读取PDF导入表的问题


  共有3398人关注过本帖树形打印复制链接

主题:关于读取PDF导入表的问题

帅哥哟,离线,有人找我吗?
hongye
  11楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:437 积分:2943 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2021/4/6 18:50:00 [只看该作者]

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:pdf读取项目.foxdb

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:5l1611330 1-18.rar

能不能帮我看看,怎么改

 回到顶部
帅哥,在线噢!
有点蓝
  12楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106041 积分:539298 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2021/4/6 20:50:00 [只看该作者]

网上搜了一圈,没找到合适的方法

 回到顶部
帅哥哟,离线,有人找我吗?
hongye
  13楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:437 积分:2943 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2021/4/7 7:33:00 [只看该作者]

那是不是可以把PDF先转换为Excel,再从Excel导入到数据表呢?这样可行吗,代码怎么写啊

 回到顶部
帅哥,在线噢!
有点蓝
  14楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106041 积分:539298 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2021/4/7 9:56:00 [只看该作者]

参考:https://blog.csdn.net/u013934107/article/details/110229287

下载dll(下载后把最后的扩展名.zip去掉再解压)复制到foxtable安装目录,然后引用
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:spire.pdf.zip.001.zip

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:spire.pdf.zip.002.zip

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:spire.pdf.zip.003.zip

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:spire.pdf.zip.004.zip

 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:spire.pdf.zip.005.zip


调用代码
Dim pdf As New Spire.Pdf.PdfDocument()
Dim pathDirectoryName As String = String.Empty
pdf.LoadFromFile("D:\问题\test.pdf")
pdf.SaveToFile("D:\问题\test.xlsx", Spire.Pdf.FileFormat.XLSX)
pdf.close

 回到顶部
帅哥哟,离线,有人找我吗?
hongye
  15楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:437 积分:2943 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2021/4/7 10:09:00 [只看该作者]

这个是把PDF图片导入,但是无法像Adobe Acrobat一样真正能导出数据表格哦
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:5l1611330 1-18.xlsx



 回到顶部
帅哥,在线噢!
有点蓝
  16楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106041 积分:539298 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2021/4/7 10:19:00 [只看该作者]

我只能做到这一步了。不合适您网上再找找其它组件看看

 回到顶部
帅哥哟,离线,有人找我吗?
hongye
  17楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:437 积分:2943 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2021/4/7 15:41:00 [只看该作者]

那有没有办法将PDF转换成XML1.0的文件

 回到顶部
帅哥,在线噢!
有点蓝
  18楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:超级版主 帖子:106041 积分:539298 威望:0 精华:9 注册:2015/6/24 9:21:00
  发帖心情 Post By:2021/4/7 16:04:00 [只看该作者]

找不到这种用法
[此贴子已经被作者于2021/4/7 16:04:45编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
hongye
  19楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:一尾狐 帖子:437 积分:2943 威望:0 精华:0 注册:2011/3/15 12:49:00
  发帖心情 Post By:2021/4/7 18:48:00 [只看该作者]

Dim reader As New iTextSharp.text.pdf.PdfReader("C:\Users\朱建斌\Documents\Foxtable项目\PDF读取项目\箱单\jnby\5l1611330 1-18.pdf")
Dim n As Integer = reader.NumberOfPages
Dim str As String = ""
Dim str1 As String
Dim str2 As String
Dim str3 As String
For i As Integer = 1 To n
    Dim strategy As object = New iTextSharp.text.pdf.parser.SimpleTextExtractionStrategy()
    Dim currentText As String = iTextSharp.text.pdf.parser.PdfTextExtractor.GetTextFromPage(Reader, i, strategy)
    currentText = Encoding.UTF8.GetString(ASCIIEncoding.Convert(Encoding.[Default], Encoding.UTF8, Encoding.[Default].GetBytes(currentText)))
    str = currentText.Replace("/", "-")
    str1 = System.Text.RegularExpressions.Regex.Replace(str,"^", "/")
    str2 = System.Text.RegularExpressions.Regex.Replace(str1," ", "/")
    str3 = System.Text.RegularExpressions.Regex.Replace(str2,"\n", "/")
Next
Dim mc = System.Text.RegularExpressions.Regex.Matches(str3 ,"/.+?/")
msgbox(mc.Count)
msgbox(Str3)
Dim nw As Integer = mc.Count
For i As Integer = 0 To nw -1
    msgbox("xs:" & mc(i).value)
Next
reader.Close()

不知道为什么里面会缺好几个数据
 下载信息  [文件大小:   下载次数: ]
图片点击可在新窗口打开查看点击浏览该文件:5l1611330 1-18.rar



[此贴子已经被作者于2021/4/7 19:35:49编辑过]

 回到顶部
帅哥哟,离线,有人找我吗?
FOTOER
  20楼 | 信息 | 搜索 | 邮箱 | 主页 | UC


加好友 发短信
等级:幼狐 帖子:154 积分:1511 威望:0 精华:0 注册:2011/8/29 20:48:00
  发帖心情 Post By:2021/11/7 14:09:00 [只看该作者]

图片点击可在新窗口打开查看

 回到顶部
总数 20 上一页 1 2