惯性聚合 高效追踪和阅读你感兴趣的博客、新闻、科技资讯
阅读原文 在惯性聚合中打开

推荐订阅源

S
Securelist
O
OpenAI News
Threat Intelligence Blog | Flashpoint
Threat Intelligence Blog | Flashpoint
T
Threat Research - Cisco Blogs
D
Darknet – Hacking Tools, Hacker News & Cyber Security
Google Online Security Blog
Google Online Security Blog
C
CXSECURITY Database RSS Feed - CXSecurity.com
N
News and Events Feed by Topic
S
Security Affairs
SecWiki News
SecWiki News
Project Zero
Project Zero
L
Lohrmann on Cybersecurity
P
Proofpoint News Feed
P
Palo Alto Networks Blog
L
LINUX DO - 最新话题
H
Hacker News: Front Page
Recent Commits to openclaw:main
Recent Commits to openclaw:main
I
Intezer
Simon Willison's Weblog
Simon Willison's Weblog
W
WeLiveSecurity
T
The Exploit Database - CXSecurity.com
K
Kaspersky official blog
The GitHub Blog
The GitHub Blog
I
InfoQ
云风的 BLOG
云风的 BLOG
雷峰网
雷峰网
B
Blog
IT之家
IT之家
AWS News Blog
AWS News Blog
Jina AI
Jina AI
freeCodeCamp Programming Tutorials: Python, JavaScript, Git & More
Google DeepMind News
Google DeepMind News
Spread Privacy
Spread Privacy
N
News and Events Feed by Topic
Security Latest
Security Latest
美团技术团队
C
Check Point Blog
WordPress大学
WordPress大学
T
Tenable Blog
S
Security @ Cisco Blogs
Last Week in AI
Last Week in AI
博客园 - 聂微东
月光博客
月光博客
博客园 - 【当耐特】
S
Schneier on Security
OSCHINA 社区最新新闻
OSCHINA 社区最新新闻
S
Secure Thoughts
Schneier on Security
Schneier on Security
C
Cisco Blogs
Cyberwarzone
Cyberwarzone

博客园 - 涂文瀚

常用的前端调试工具 用户中心 - 博客园 SQL中动态进行行转列 SQL SERVER 表分区实施步奏 [记录]SQL SERVER 跨库操作小记 PHP常见面试问题 在WIN下搭建PHP的测试、开发环境 [转]三款免费的PHP加速器:APC eAccelerator XCache比较 Xdebug如何选择PHP版本 PHP Cookbook读书笔记 – 第01章字符串 PHP Cookbook读书笔记 – 第03章日期和时间 PHP Cookbook读书笔记 – 第02章数字 PHP Cookbook读书笔记 – 第04章数组 PHP Cookbook读书笔记 – 第06章函数 PHP Cookbook读书笔记 – 第07章类和对象 PHP Cookbook读书笔记 – 第08章web基础 设计模式之观察者模式 PHP Cookbook读书笔记 – 第09章表单 PHP Cookbook读书笔记 – 第11章Session和持久化
PHP Cookbook读书笔记 – 第12章XML
涂文瀚 · 2011-12-07 · via 博客园 - 涂文瀚

什么是XML?

XML(eXtensible Markup Language)是国际标准化组织的标准通用标记语言SGML的子集。由以下规范组成:

  • 可扩展样式语言(eXtensible Sytle Language , XSL)
  • XML链接语言(XML Linking Language,包括Xpath、Xlink和Xpointer)
  • XML名称空间(XML Namespace)

在PHP5之前的版本对XML的处理存在很多的问题,例如XML工具之间只具有简单的关联、每个工具不能一起协同工作等,PHP5中的新XML扩展具有下列特点:

  • 能够像一个整体一样协调工作
  • 是一个标准化的XML库:libxml2
  • 完全遵循W3C规范
  • 更有效地处理数据
  • 是你工作中合适的XML工具

HTML和XML区别与联系?

HTML和XML都是SGML的子集,所以他们有很大的相似性。下面是XML相对于HTML具有的独特性:

  • 可扩展性,用以定义需要的新标记。这对于今天的web是很有意义的
  • 结构,用于表示任意复杂程度的数据。从某种意义上说是一个小型的关系数据库
  • 校验,用以检查数据的结构正确性。通过DTD约束可以达到这一目的。
  • 媒体无关性,以多种格式发布内容。网页、手机显示的wml、其他媒体终端的显示等
  • 厂商和平台中立
  • 数据的表示与内容分离(这是与html本质区别,但现在流行的DIV+CSS设计思路与这种近似)
  • XML的元素区分大小写
  • 任何元素都需要有结束标记
  • XML只有一个根元素
  • 属性必须加上引号

一个完整的XML长什么样子?

<?xml version="1.0"?>
<shows>
    <show>
        <name>Simpsons</name>
        <channel>FOX</channel>
        <start>8:00 PM</start>
        <duration>30</duration>
    </show>
    <show>
        <name>Law & Order</name>
        <channel>NBC</channel>
        <start>8:00 PM</start>
        <duration>60</duration>
    </show>
</shows>

形式良好的XML文档须具备下列特征:

  • 每一个元素有一个开始和结束标记
  • 文档有且只有一个根元素,其他的所有元素都是它的子元素
  • 正确的格式化空元素
  • 标记的大小写匹配
  • 正确的嵌套
  • 属性值必须用引号
  • 实体在引用之前必须声明
  • 实体不能循环指向自身

通过DOM生成XML

 
// 创建一个新的文档
$dom = new DOMDocument('1.0'); // 创建一个根元素<book>并将其添加到文档
$book = $dom->appendChild($dom->createElement('book')); // 创建一个title子元素,并添加到$book中 $title = $book->appendChild($dom->createElement('title')); // 设置title元素的文本及cover属性 $title->appendChild($dom->createTextNode('PHP Cookbook')); $title->setAttribute('cover', 'soft'); // 创建并将author元素添加到$book中 $sklar = $book->appendChild($dom->createElement('author')); //添加文本到author节点
$sklar->appendChild($dom->createTextNode('Sklar')); $trachtenberg = $book->appendChild($dom->createElement('author')); $trachtenberg->appendChild($dom->createTextNode('Trachtenberg')); // 输出完美格式化的XML文档
$dom->formatOutput = true; echo $dom->saveXML();

输出内容如下:

<?xml version="1.0"?>
<book?>
  <cover="soft">PHP Cookbook</title>
</book>

用PHP解析已经存在的XML文件

常用有三种方式来解析XML文件

  1. 对于简单文件采用SimpleXML
  2. 对于复杂的XML文件采用DOM扩展来实现
  3. 对于大型XML文件采用XMLReader扩展来实现

XML示例文件如下(address-book.xml):

<?xml version="1.0"?>
<address-book>
    <person id="1">
        <!--David Sklar-->
        <firstname>David</firstname>
        <lastname>Sklar</lastname>
        <city>New York</city>
        <state>NY</state>
        <email>sklar@php.net</email>
    </person>

    <person id="2">
        <!--Adam Trachtenberg-->
        <firstname>Adam</firstname>
        <lastname>Trachtenberg</lastname>
        <city>San Francisco</city>
        <state>CA</state>
        <email>amt@php.net</email>
    </person>
</address-book>

通过SimpleXML方式:

$sx = simplexml_load_file('address-book.xml');

foreach ($sx->person as $person) {
    $firstname_text_value = $person->firstname;
    $lastname_text_value = $person->lastname;

    print "$firstname_text_value $lastname_text_value\n";
}

通过DOM扩展:

 
$dom = new DOMDocument;
$dom->load('address-book.xml');

foreach ($dom->getElementsByTagname('person') as $person) {
    $firstname = $person->getElementsByTagname('firstname');
    $firstname_text_value = $firstname->item(0)->firstChild->nodeValue;

    $lastname = $person->getElementsByTagname('lastname');
    $lastname_text_value = $lastname->item(0)->firstChild->nodeValue;

    print "$firstname_text_value $lastname_text_value\n";
}

通过XMLReader扩展:

$reader = new XMLReader();
$reader->open('card-catalog.xml');

while ($reader->read()) {
    if ($reader->nodeType == XMLREADER::ELEMENT && $reader->localName == 'author') {
        $reader->read();
        print $reader->value . "\n";
    }
}

用XPath来查询信息

在SimpleXML和DOM扩展中都有XPath

//SimpleXml示例
$emails = $s->xpath('/address-book/preson/email');

//DOM扩展示例
$xpath = new DOMXPath($dom);
$email = $xpath->query('/address-book/preson/email');

验证XML文档是否合法

在PHP中,DOM扩展支持基于DTD,XML Schema和RelaxNG的验证,而SimpleXML则只提供了XML Schema验证。

XML内容为UTF-8格式

如果数据来源为其他格式,需要经过编码为UTF-8格式,下面是通过iconv库进行转换的示例

$utf_8 = iconv('ISO-8859-1', 'UTF-8', $iso_8859_1);

其他参考资料:《PHP高级开发技术与实例》 清华大学出版社