Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

在页面采集多列元素的时候,数据筛选新生成时,漏数据 #370

Open
netmonitor opened this issue May 4, 2024 · 5 comments

Comments

@netmonitor
Copy link

在页面进行同类元素采集的时候,数据拆分呈现时有bug:

  1. 正常情况下: 执行:选中子元素 -选项的时候,子元素里有规律的多段数据会被拆分到不同字段显示。
  2. 不正常情况下: 执行:选中子元素 -选项的时候,原本子元素里有规律的多段数据会被拆分到不同字段显示,但是会有个别内容会被错误拆分,形成与正常情况下要多出1个字段。原本相同显示的字段又是空白。

QQ图片20240504155121
QQ图片20240504155127

@NaiboWang
Copy link
Owner

这不是bug,而是页面结构就是这样设计的,子元素分割是按照标签类型来的,可以看一下两个字段的XPath,应该不是同一个。

@netmonitor
Copy link
Author

netmonitor commented May 4, 2024 via email

@NaiboWang
Copy link
Owner

这种情况,你把两个字段的字段名设置成同一个名称就可以把数据放在同一列了。

@netmonitor
Copy link
Author

netmonitor commented May 4, 2024 via email

@NaiboWang
Copy link
Owner

如果是你给的图的情况不应该采集不到,但如果是两个字段在同一个大块同时出现那么后面的字段会覆盖前面字段的值,这时候只能分开采集两个字段再手动合并一下,或者按照你图1的方式采集再手动拆分。

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

No branches or pull requests

2 participants