博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
python使用ElementTree解析XML文件
阅读量:6704 次
发布时间:2019-06-25

本文共 914 字,大约阅读时间需要 3 分钟。

一、将XML网页保存到本地

要加载XML文件首先应该将网页上的信息提取出来,保存为本地XML文件。抓取网页信息可以python的urllib模块。

代码如下:

from urllib import urlopenurl = "http://********/**"resp = urlopen(url).read()f = open('文件保存路径', 'w')f.write(resp)f.close()

 

二、解析XML文件

python有许多可以用来解析XML文件的函数,在这里介绍ElementTree(简称ET).它提供轻量级的python式API。实现逻辑简单,解析效率高。利用ET解析XML文件的方法是:先找出父级标签,然后再一级一级循环找出所需要的子标签,代码如下:

import xml.etree.cElementTree as ETtree = ET.parse("***.xml")  #加载xml文件root = tree.getroot()  #得到第二级标签for child_of_root in root[1]:#root[1]为第二级标签中的第二个子标签     for child1 in child_of_root[7]: #原理同上        for child2 in child1:            print child2.tag, child2.attrib, child2.text    for child3 in child_of_root[8]:        for child4 in child3:            print child4.tag, child4.attrib, child4.text

在上述代码中,child_of_root[7]表示在该级标签中的第八个子标签,在for child2 in child1中是遍历child1的所有子标签,打印出子标签的名称、属性、文本。这样就可以将XML文件解析完成,得到我们所想要的信息。

转载于:https://www.cnblogs.com/l5623064/p/8574624.html

你可能感兴趣的文章
excel在msdn上的说明文档
查看>>
指尖下的js ——多触式web前端开发之一:对于Touch的处理(转)
查看>>
visual studio 2013使用技巧
查看>>
Sublime Text 相关
查看>>
深入理解css优先级
查看>>
Android MediaPlayer状态机
查看>>
Material Design Animation
查看>>
ASP.NET MVC搭建项目后台UI框架—3、面板折叠和展开
查看>>
(C语言)memcpy函数原型的实现
查看>>
Theano2.1.1-基础知识之准备工作
查看>>
FreeBSd ports 安装软件
查看>>
DevExpress.Build
查看>>
ACCESS-如何多数据库查询(跨库查询)
查看>>
iOS:转载sqlite3
查看>>
java并发编程学习:用 Semaphore (信号量)控制并发资源
查看>>
HDU 2070 Fibbonacci Number
查看>>
Cocos2d-x 3.2 大富翁游戏项目开发-第五部分 单机游戏-级别选择ScrollView
查看>>
Win10系统菜单打不开问题的解决,难道是Win10的一个Bug ?
查看>>
好玩的注释
查看>>
一张二维码同时集成微信、支付宝支付
查看>>