快捷导航
        网页已经附件上传

        1.png (35.17 KB, 下载次数: 2)

        1.png

        桌面.zip

        1.02 MB, 下载次数: 2

        桌面.zip

        1.02 MB, 下载次数: 0

        举报 使用道具
        | 回复

        共 13 个关于本帖的回复 最后回复于 2020-7-3 17:23

        沙发
        ykmbllw 初级会员 发表于 2020-7-3 09:47:56 | 只看该作者
        XPATH定位     ://*[@class='next-tabs-tabpane']/div[position()=2]/div[position()=2]/div/table/tbody/tr/td[position()=3]<context>//*[@id='J_autoHeight']</context>      所有数据在同一个字段里面  如何做  样例复制
        举报 使用道具
        板凳
        Fuller 管理员 发表于 2020-7-3 10:05:27 | 只看该作者
        你的规则名是什么?

        要改写xpath中的 td[position()=3],不能定死在3的位置,要根据某个标志,比如,td中的某个特殊的文字
        举报 使用道具
        地板
        Fuller 管理员 发表于 2020-7-3 10:06:11 | 只看该作者
        td中有没有标志性的文字?那样就可以把td[position()=3]变成td[contains(text(), 'xxxx')]
        举报 使用道具
        5#
        ykmbllw 初级会员 发表于 2020-7-3 13:42:48 | 只看该作者
        Fuller 发表于 2020-7-3 10:05
        你的规则名是什么?

        要改写xpath中的 td,不能定死在3的位置,要根据某个标志,比如,td中的某个特殊的文 ...

        规则名:订单价格永久最新域名地址      需要账号登入   已经把网页保存  上传到附件中   
        举报 使用道具
        6#
        ykmbllw 初级会员 发表于 2020-7-3 14:09:01 | 只看该作者
        Fuller 发表于 2020-7-3 10:06
        td中有没有标志性的文字?那样就可以把td变成td[contains(text(), 'xxxx')]

        //div[contains(text(),"*")]<context>//*[@id='J_autoHeight']</context>    通过  这个XPATH  可以检索到 所有  需要永久最新域名地址的  但放入  永久最新域名地址中  永久最新域名地址到的是空白数据
        举报 使用道具
        7#
        Fuller 管理员 发表于 2020-7-3 14:53:44 | 只看该作者
        contains(text(),"*") 表示只有含有*,就永久最新域名地址下来。这个条件是不是太宽泛了?

        另外,如果使用了样例复制,xpath的开头不能是 // ,否则,永久最新域名地址到的可能都一样。你改成 .// 试试
        举报 使用道具
        8#
        ykmbllw 初级会员 发表于 2020-7-3 15:18:38 | 只看该作者
        Fuller 发表于 2020-7-3 14:53
        contains(text(),"*") 表示只有含有*,就永久最新域名地址下来。这个条件是不是太宽泛了?

        另外,如果使用了样例复制, ...

        因为 他们的  共同的  内容  就是含有    *    添加.//   数据会空白

        //*[@class='next-tabs-content']/div/div[position()=2]/div[position()=2]/div/table/tbody/tr/td/div[contains(text(),'*')]/text()

        现在  永久最新域名地址内容能出来     但是  是在同一个字段中   该如何处理

        1.png (48.3 KB, 下载次数: 2)

        1.png
        举报 使用道具
        9#
        小蜜蜂测试162 初级会员 发表于 2020-7-3 15:43:01 | 只看该作者
        ykmbllw 发表于 2020-7-3 15:18
        因为 他们的  共同的  内容  就是含有    *    添加.//   数据会空白

        //*[@class='next-tabs-content']/ ...

        这些数据在网页原始数据中就是都包含在一个text()下?
        举报 使用道具
        10#
        ykmbllw 初级会员 发表于 2020-7-3 15:51:35 | 只看该作者
        小蜜蜂测试162 发表于 2020-7-3 15:43
        这些数据在网页原始数据中就是都包含在一个text()下?

        不是在同一个   TEXT下面   
          路径是   
        样例映射1:【宝贝名称://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=3]/ div/text()<context>//*[@id='J_autoHeight']</context>   
        成交价格://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=5]/ div/text()<context>//*[@id='J_autoHeight']</context>】

        样例映射2:【宝贝名称://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=1]/ div/text()<context>//*[@id='J_autoHeight']</context>   
        成交价格://*[@class='next-table-body']/table/tbody/tr(多个)/td[position()=3]/ div/text()<context>//*[@id='J_autoHeight']</context>】


        都在    TD这个节点里面   但是   样例1的数据TD 在 3和5     样例2  的数据TD在1和3   使用样例复制 的话    样例2  就会被强制  变成    3和5    导致数据 错误
        举报 使用道具
        您需要登录后才可以回帖 登录 | 立即注册

        精彩推荐

        • 数据管家和集搜客网络爬虫超出配额是怎么回
        • 用GooSeeker数据管家能永久最新域名地址微博内容吗?
        • 怎样使用GooSeeker数据管家启动永久最新域名地址任务?
        • GooSeeker数据管家软件使用指导
        • 如何使用集搜客分词平台做社会网络图分析?

        热门用户

        GMT+8, 2020-8-5 19:05