华人澳洲中文论坛

热图推荐

    持分请教:PDF格式都一样,如何批量提取数据,形成Excel表格?

    [复制链接]

    2022-10-9 13:34:30 8080 8

    经常会有几十上百张的pdf文件,需要我从中选取数据然后填到excel表格当中。当然前提是所有这些pdf表格的格式都是一模一样的.


    如果会用vba,当然这个问题就很容易解决了,但是在不会用vba的情况下,有没有什么app是能够帮助我们能够很快的从pdf单中提取数据形成excel表格的?

    在google上搜了一下,没有搜到答案,只好来这里求助大家了

    分分伺候!

    全部回复8

    master0826 发表于 2022-10-9 12:42:26

    master0826 沙发

    2022-10-9 12:42:26

    打开PDF,  CTRAL+ A 然后 CTRL + C

    打开EXCEL,  CTRL + V

    然后你自己看看能怎么用分列功能把各个数据列分出来,有可能是分隔符,有可能是固定宽度,也有可能根本分不出来,那取决于你原来的PDF文件的情况。

    如果在EXCEL里面各个数据列能分出来,那么就再全选上个FILTER,多半就可以把无用的各种行都删掉,
    只留下有用数据。

    以上方法有大概50%成功率。
    certtin 发表于 2022-10-9 12:46:48

    certtin 板凳

    2022-10-9 12:46:48

    买个付费的PDF Editor然后用它转Excel

    Time is money,friend
    到处看看 发表于 2022-10-9 12:53:07

    到处看看 地板

    2022-10-9 12:53:07


    如果原PDF文件是Excel或者Word直接生成的,你说的这种复制粘贴的办法可行。

    如果原PDF文件是从扫描生成的,要用PDF或者OCR工具转化后才能复制粘贴。

    还在用尿布 发表于 2022-10-9 13:03:33

    还在用尿布 5#

    2022-10-9 13:03:33

    手工做吧,且做且珍惜这个磨洋工的机会
    何媛 发表于 2022-10-9 13:09:34

    何媛 6#

    2022-10-9 13:09:34

    批量转换pdf to excel可以用 ABBYY Finereader,最强OCR软件之一

    如果你的PDF表格本身就是数字格式,那就直接用ADOBE ACROBAT PRO DC生成EXCEL

    但是无论用什么软件生成EXCEL,成品格式都很难保持一致,想用VBA批量转换不太容易,最后还是要手工校正的。

    赵沙 发表于 2022-10-9 13:15:54

    赵沙 7#

    2022-10-9 13:15:54

    就这样的问题应该很多人都遇到过,虽然我不会,但是我记得PayPal在生成报告的时候会有Excel和PDF选项,楼主的问题应该有答案
    chychy1111 发表于 2022-10-9 13:24:53

    chychy1111 8#

    2022-10-9 13:24:53


    如果会编程的话,可以
    1. 用Java库,把文字提取出来,然后用regx把具体每个域提取。
    或者
    2. 调aws或者谷歌api
    如果不会编程,可以试一下bgl smart doc。
    http://doc.com.ai/home.html
    ww100 发表于 2022-10-9 13:34:30

    ww100 9#

    2022-10-9 13:34:30


    有现成的软件,譬如说Teleform,专门干这些事情的,自带OCR。类似的软件可以看http://www.g2.com/products/teleform/competitors/alternatives

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    注册会员
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题27

    帖子38

    积分169

    图文推荐