spider编写规则 - ShichaoMa/structure_spider GitHub Wiki

传入item_loader, response，使用item_loader的方法(add_value, add_xpath, add_re)添加要抓取的属性名(必须在item中有定义)及其对应表达式或值。
如此次渲染需要产生子请求，比如抓取豆瓣作者详细信息，则通过response.meta["item_collector"]提供的(add, extend)方法，将(prop, item_loader, request_meta)添加到item_collector中。其中：
- prop: 下次请求获取的全部字段如果是做为一个子item返回，子item在其父item中对应的字段名称。如"author": {子item数据结构}，此时prop="author"
- item_loader: 用来抽取下次请求中字段的item_loader，如果下次请求返回子item，则此item_loader必须是子item构造的item_loader，如CustomLoader(item=AuthorItem())
- request_meta: 组建Scrapy.Request所需要的kwargs。type: dict