华人澳洲中文论坛

热图推荐

    寻觅一个拥有能列表某网站某目录下一切文件的软件

    [复制链接]

    2021-5-17 17:19:59 724 22

    某个网站的某个目录,外面有许多PDF文件。

    假如你知道某个文件的详细名字,那末用这个目录的链接+详细文件名,就能彻底显示这个PDF文件的详细内容。
    假如文件名错了,就显示不出来。

    能有甚么软件,能够列出这个目录下的一切PDF文件的名字吗?我用了downitall,不行。

    必加分感激。

    全部回复22

    花蔻儿 发表于 2021-5-17 16:13:04

    花蔻儿 沙发

    2021-5-17 16:13:04

    应该是需求登陆用户有list权限
    匿名用户应该没有list权限,不然允许匿名一个用户间接下去list网站目录下一切文件而后挨个下载找破绽那这些做网站开发的间接能够回家了
    海魔 发表于 2021-5-17 16:15:56

    海魔 板凳

    2021-5-17 16:15:56

    没有这样的软件,除非你是办理员或者网站被黑了
    leap 发表于 2021-5-17 16:21:27

    leap 地板

    2021-5-17 16:21:27

    对了,谷歌爬虫有这个功用
    ligangang 发表于 2021-5-17 16:22:40

    ligangang 5#

    2021-5-17 16:22:40


    能详细些吗?怎么用?
    maxwoo 发表于 2021-5-17 16:25:30

    maxwoo 6#

    2021-5-17 16:25:30


    详细怎么个用法?

    如:http://aaa.com/bbb/ccc/*.pdf



    根据你的提醒,在Google外面搜寻:

    InURL:目录名  Filetype:PDF site:aaa.com


    这个目录名该填甚么?
    bbb/ccc/

    仍是
    bbb/ccc

    仍是
    ccc

    ?

    时间 发表于 2021-5-17 16:28:28

    时间 7#

    2021-5-17 16:28:28

    真够费事的,  为何要list呢。这个真的需求爬虫来做的。 google python 爬虫吧。
    此外找个下载软件。 相似jdownloader 能够自动监听这个URL上面的media files - PDF 或者视频均可下列载。
    yjq 发表于 2021-5-17 16:31:31

    yjq 8#

    2021-5-17 16:31:31


    为何要LIST? - 由于我想知道外面有哪些文件是我感兴致的。
    JDDOWNLOAD我有装置呀,但怎么使用?


    w2xking 发表于 2021-5-17 16:36:18

    w2xking 9#

    2021-5-17 16:36:18


    现状就是假如你不花点心理弄爬虫,简直没有现成的工具能够对他人的网站子目录的文件进行列表。
    jdownloader你拷贝黏贴URL而后选择pdf文件扩展名,开启下载之后。会看到得多得多,而后选择阿谁要要个不要就行-了。
    天真的创伤 发表于 2021-5-17 16:38:46

    天真的创伤 10#

    2021-5-17 16:38:46

    此外下载的时分不要开启过量的线程, 有些网站会对这类行动检测有的时分会block你的ip地址。 所以能够缓缓下载。
    tangdou313 发表于 2021-5-17 16:42:34

    tangdou313 11#

    2021-5-17 16:42:34


    AllInURL: BBB CCC  Filetype:PDF site:aaa.com
    wgz3333 发表于 2021-5-17 16:45:04

    wgz3333 12#

    2021-5-17 16:45:04


    试了,没起作用。
    gxzh 发表于 2021-5-17 16:49:31

    gxzh 13#

    2021-5-17 16:49:31

    那就是网站设置了flag,不准爬。
    hhhppp666 发表于 2021-5-17 16:53:14

    hhhppp666 14#

    2021-5-17 16:53:14


    试了一下,不行呀。

    好比,我知道有一个文件的地址:

    http://aaa.com/bbb/ccc/ddd.pdf
    当初想查 http://aaa.com/bbb/ccc/ 目录下一切的PDF文件,该怎么用?

    tom_morgan 发表于 2021-5-17 16:55:24

    tom_morgan 15#

    2021-5-17 16:55:24


    复制黏贴-- http://aaa.com/bbb/ccc 这层目录
    sea611 发表于 2021-5-17 16:58:53

    sea611 16#

    2021-5-17 16:58:53


    而后呢?
    昭靈 发表于 2021-5-17 17:02:45

    昭靈 17#

    2021-5-17 17:02:45

    链接抓取器,复制黏贴,看是不是可以抓掏出来。
    xyp87 发表于 2021-5-17 17:04:09

    xyp87 18#

    2021-5-17 17:04:09


    各种形式都试过了,没有作用
    亮亮 发表于 2021-5-17 17:08:51

    亮亮 19#

    2021-5-17 17:08:51


    广泛来讲假如知道名字就能下载的话,也就是说允许你curl这个URL,最少我用过的相似状况均可以抓取。  你尝试着换URL到上一次目录试试看。  从/aaa/bbb 换成/aaa这类状况
    chendq 发表于 2021-5-17 17:10:14

    chendq 20#

    2021-5-17 17:10:14


    刚试,仍是不行。

    但只输出网站地址,不列子/孙目录,倒是能够列出一些图片文件,阿谁已知的子目录/孙目录都没有列出来,没有PDF文件列出来。

    估量网站做了限度。
    air 发表于 2021-5-17 17:14:47

    air 21#

    2021-5-17 17:14:47

    h妹妹 假如是有copyright的一些document,那根本上是这样的。
    mk-999 发表于 2021-5-17 17:15:58

    mk-999 22#

    2021-5-17 17:15:58


    只有我想对文件名,就能列出/下载。
    thq1231 发表于 2021-5-17 17:19:59

    thq1231 23#

    2021-5-17 17:19:59

    我以前用global fetch软件  间接把整站的文件下载上去

    发表回复

    您需要登录后才可以回帖 登录 | 立即注册

    返回列表 本版积分规则

    :
    论坛元老
    :
    论坛短信
    :
    未填写
    :
    未填写
    :
    未填写

    主题330

    帖子4643

    积分10468

    图文推荐