【未解决】汽车之家车型车系数据:有些参数字段的值包含span特殊标签
crifan 4年前 (2020-09-02) 1138浏览 0评论
折腾: 【未解决】用Python爬取汽车之家的车型车系详细数据 期间,看到爬取数据中,除了之前已知的: 【已解决】汽车之家车型车系数据:车身结构的值包含span标签 结果发现更多字段有此问题: 并且: carModelEnvStandard 从页面...
crifan 4年前 (2020-09-02) 1138浏览 0评论
折腾: 【未解决】用Python爬取汽车之家的车型车系详细数据 期间,看到爬取数据中,除了之前已知的: 【已解决】汽车之家车型车系数据:车身结构的值包含span标签 结果发现更多字段有此问题: 并且: carModelEnvStandard 从页面...
crifan 4年前 (2020-09-02) 1942浏览 0评论
最新代码,抓取结果中发现有: 5门7座<span class='hs_kw3_configHz'></span> https://www.autohome.com.cn/spec/46292/#pva...
crifan 4年前 (2020-09-01) 1308浏览 0评论
折腾: 【已解决】汽车之家车型车系数据:解决部分车型基本参数字段个数不一致问题 期间,发现虽然参数配置的数据没啥问题,但是好像第一批数据中 carBrandId就是空的: 所以需要去搞清楚,是否正常 https://www.autohome.com...
crifan 4年前 (2020-09-01) 1264浏览 0评论
折腾: 【已解决】汽车之家车型车系数据:解决部分车型基本参数字段个数不一致问题 期间,看到抓包出来的数据中,能源类型有: 空白 的 -》看起来 空白是有问题的 需要去研究看看 有264个 去研究看看 https://www.autoho...
crifan 4年前 (2020-08-28) 1472浏览 0评论
对于: 【已解决】汽车之家车型车系数据:优化去掉js加速抓取车型参数配置 去调试,结果运行报错 list index out of range mIndex=16 in getItemFirstValue 很明显是: 列表index超出最大个数了。 ...
crifan 4年前 (2020-08-27) 1754浏览 0评论
折腾: 【已解决】汽车之家车型车系数据:抓取车型的详细参数配置 期间,已经基本上实现了获取参数配置数据了。 但是有个问题: 进入参数配置页面时,是通过: # https://car.autohome.com.cn/config/sp...
crifan 4年前 (2020-08-25) 1675浏览 0评论
之前已抓取的数据: 【已解决】汽车之家车型车系数据:支持旧版车系页面 中,后来发现缺少了部分数据 现在去研究看看原因 以品牌红旗为例 在售车型为例 红旗H5,在售车型12款 2020款相关数据没有抓取到 【车型大全】汽车车型大全_汽车之家 【红旗...