New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
在页面采集多列元素的时候,数据筛选新生成时,漏数据 #370
Comments
这不是bug,而是页面结构就是这样设计的,子元素分割是按照标签类型来的,可以看一下两个字段的XPath,应该不是同一个。 |
感谢能在放假期间还能快速回复,附件是我的脚本,能否帮指点一下,如何才能完整的获取到跨字段的评论吗?谢谢。
…------------------ 原始邮件 ------------------
发件人: "NaiboWang/EasySpider" ***@***.***>;
发送时间: 2024年5月4日(星期六) 下午4:04
***@***.***>;
***@***.******@***.***>;
主题: Re: [NaiboWang/EasySpider] 在页面采集多列元素的时候,数据筛选新生成时,漏数据 (Issue #370)
这不是bug,而是页面结构就是这样设计的,子元素分割是按照标签类型来的,可以看一下两个字段的XPath,应该不是同一个。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
这种情况,你把两个字段的字段名设置成同一个名称就可以把数据放在同一列了。 |
把需要合并的字段都改同一个名字,其中一个字段会采集不到。
…------------------ 原始邮件 ------------------
发件人: "NaiboWang/EasySpider" ***@***.***>;
发送时间: 2024年5月4日(星期六) 下午4:18
***@***.***>;
***@***.******@***.***>;
主题: Re: [NaiboWang/EasySpider] 在页面采集多列元素的时候,数据筛选新生成时,漏数据 (Issue #370)
这种情况,你把两个字段的字段名设置成同一个名称就可以把数据放在同一列了。
—
Reply to this email directly, view it on GitHub, or unsubscribe.
You are receiving this because you authored the thread.Message ID: ***@***.***>
|
如果是你给的图的情况不应该采集不到,但如果是两个字段在同一个大块同时出现那么后面的字段会覆盖前面字段的值,这时候只能分开采集两个字段再手动合并一下,或者按照你图1的方式采集再手动拆分。 |
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
在页面进行同类元素采集的时候,数据拆分呈现时有bug:
The text was updated successfully, but these errors were encountered: