使用extract方法进行内容抽取的时候如果加了对body内容的xpath配置就报错 #104

tranzwalle · 2020-12-23T03:02:27Z

使用GeneralNewsExtractor的extract方法进行内容抽取的时候如果加了对body内容的xpath配置就报错

如何复现

屏幕截图

使用环境:

kingname · 2020-12-23T06:44:31Z

你可以显看看，你获取到的html_content里面，有没有rich_media_content这个class

tranzwalle · 2020-12-23T09:25:58Z

你可以显看看，你获取到的html_content里面，有没有rich_media_content这个class

返回的是有那个class的，只是这个方法里面有个selector参数，在这个地方源码没有传，导致进去用下标获取时会报错

kingname · 2020-12-24T16:39:05Z

这个 selector 参数就是我传进去的 element。

tranzwalle added the bug Something isn't working label Dec 23, 2020

tranzwalle assigned kingname Dec 23, 2020

Provide feedback