xml文件很大python方法提取节点中多行文本怎么办,xmlpython,我遇到的xml文本是这样
xml文件很大python方法提取节点中多行文本怎么办,xmlpython,我遇到的xml文本是这样
我遇到的xml文本是这样的:
<item><review_id>0079029</review_id><summary>的确是很浅显 适合什么都不懂 或者几乎什么都不懂的超级菜鸟</summary><text>非常不幸我就是这种对于数据分析 对于excel 几乎什么都不懂的超级菜鸟非常幸运我买了这本书作为打基础的书 还是非常不错的蛮不错的入门 而且深深的勾起了我对数据分析的兴趣天晓得我大学的时候统计学几乎挂科的反正打算先看完这本书 差不多学完了这些就应该能满足我目前的工作需要了以后再看情况要不要深入学习吧</text><category>book</category></item>
如果我通过xml.etree.ElementTree.iterparse来提取:
for event, elem in iterparse(item_xml_file): if elem.tag == 'item': ...
就会出现这样的错误:
Traceback (most recent call last): File "<input>", line 1, in <module> File ".../process.py", line 25, in process_cn for event, elem in iterparse(item_xml_file): File "<string>", line 91, in nextParseError: not well-formed (invalid token): line 5, column 3
是不是SAX的方法不能提取节点中的多行文本,如果不行,那应该用什么?如果xml文件很大,又该怎么办呢?
换了台机子,又可以了。这叫什么事啊?
编橙之家文章,
相关内容
- 说Python多线程是伪命题正确吗?,python多线程伪命题,我
- Python用mysql.connector select报错如何解决,,python中使用m
- Python什么方法可以将多行unicode字符串前u去除,pythonu
- 正则匹配出每一条记录后面的python字符串,怎么做?,
- Ruby语言对于研究网络安全方面会有提升吗?,ruby网络安
- Django写博客model关于这块该怎么写,djangomodel,初学编程
- Python第三方模块中有限制频率的模块吗,python第三方
- Python将字典转成scipy sparse matrix求方法,scipysparse,我的数
- 求指导python spark读入文件不能正常载入的原因,python
- Python爬虫爬豆瓣遇到Error 403问题怎么解决,python403,昨天
评论关闭