【未解决】汽车之家车型车系数据:有些参数字段的值包含span特殊标签
crifan 4年前 (2020-09-02) 1169浏览 0评论
折腾: 【未解决】用Python爬取汽车之家的车型车系详细数据 期间,看到爬取数据中,除了之前已知的: 【已解决】汽车之家车型车系数据:车身结构的值包含span标签 结果发现更多字段有此问题: 并且: carModelEnvStandard 从页面...
crifan 4年前 (2020-09-02) 1169浏览 0评论
折腾: 【未解决】用Python爬取汽车之家的车型车系详细数据 期间,看到爬取数据中,除了之前已知的: 【已解决】汽车之家车型车系数据:车身结构的值包含span标签 结果发现更多字段有此问题: 并且: carModelEnvStandard 从页面...
crifan 4年前 (2020-09-02) 2003浏览 0评论
最新代码,抓取结果中发现有: 5门7座<span class='hs_kw3_configHz'></span> https://www.autohome.com.cn/spec/46292/#pva...
crifan 4年前 (2020-09-01) 1291浏览 0评论
折腾: 【已解决】汽车之家车型车系数据:解决部分车型基本参数字段个数不一致问题 期间,看到抓包出来的数据中,能源类型有: 空白 的 -》看起来 空白是有问题的 需要去研究看看 有264个 去研究看看 https://www.autoho...
crifan 4年前 (2020-08-28) 1511浏览 0评论
对于: 【已解决】汽车之家车型车系数据:优化去掉js加速抓取车型参数配置 去调试,结果运行报错 list index out of range mIndex=16 in getItemFirstValue 很明显是: 列表index超出最大个数了。 ...
crifan 4年前 (2020-08-27) 1788浏览 0评论
折腾: 【已解决】汽车之家车型车系数据:抓取车型的详细参数配置 期间,已经基本上实现了获取参数配置数据了。 但是有个问题: 进入参数配置页面时,是通过: # https://car.autohome.com.cn/config/sp...
crifan 4年前 (2020-08-22) 1641浏览 0评论
之前已经完成了: 【已解决】汽车之家车型车系数据:支持新版车系页面 后来发现有些旧版车系页面,html网页结构不一样 所以要再去添加支持 也意味着之前抓包结果会漏掉这些: 旧版车系页面 举例 Q开头 https://www.autohome.co...
crifan 4年前 (2020-08-22) 1668浏览 0评论
折腾: 【未解决】用Python爬取汽车之家的车型车系详细数据 期间,经过调试,已经支持了新版的 车系详情页面 具体细节是: 从入口 https://www.autohome.com.cn/car/ 研究后发现是: 每个车系,都可以从 英文字母页面获...