掌握XML系列(2)--创建格式良好的XML文档

来源:岁月联盟 编辑:zhuzhu 时间:2009-01-12

  前言:XML听起来,看起来就是一本标记语言,但是它确实是一个很大的话题,值得我们去研究的!感谢大家对前一篇XML文章的关注!

  创建格式良好的XML文档,其实就是使得我们的XML文档能够符合W3C的XML1.0规范,相信大家也想看W3C条条框框的规范,我们就从实际出发,来说说,怎么样写XML文档.

  1.XML中元素:

  前面我们说过,XML的语法要求很严格的,所有的XML标记要关闭的.包含两点:首先.每个XML的开始标记,如<person>都必须有一个XML的结束标记</person>,例子如下:

  Code

<person>
<name>
 <firstname>xiao</firstname>
<lastname>yang</lastname>
</name>
</person>

  其次就是,如果元素没有子元素或者数据,那么就使用空元素的语法来关闭.如:

  Code

<person>
<name firstname="xiao" lastname="yang"/>
</person>

  所以,要关闭所有的元素,而且每个层结结构都必须在相同的级别上打开和关闭,如下就不正确:

  Code

<person>
<name>
//---------------------
 <firstname>xiao
</name>
 </firstname>
//--------------------
</person>

  大家看看中间我用两条线标记的部分,<name>是<firstname>的父元素,但是他们关闭的层次有问题,应该先关闭firstname,然后才是name.

  以上讲的只是创建良好XML文档的最基本的规则,下面我们就来详细的说下更多的规则,我会在中间穿插很多的例子,避免枯燥.

  1.1文档根的

  XML文档必须有唯一的文档根.根元素包含其余的文档数据,换言之,其余的部分就是根元素的子元素,如下就不不对:

  Code

<?xml version="1.0" ?>
<capitals>
<country name="china">beijing</country>
<country name="usa">w d.c</country>
</capitals>
<population>
<num>12</num>
</population>

  上面的文档有两个根元素<capitals>和<population>,所以格式不良好,要使得格式良好就要改改.如下(其实改的方式很多的,只要有唯一的根元素就行):

  Code

<?xml version="1.0" ?>
<data>
<capitals>
 <country name="china">beijing</country>
 <country name="usa">w d.c</country>
</capitals>
<population>
 <num>12</num>
</population>
</data>

  上面的就行了.

  1.2 合法和不合法的名称

  在XML中使用元素要遵守一些命名规范,即区分大小写等.下面的就是代表不同的元素,尽管意思一样:

     ,<person>,<PERSON>,<Person>.

  此外还有一些规则:

  (1)"<"字符之后不能存在空格,如<person name>就不行,而<personname>就可以 

  (2) 元素的名字不能以数字或者标记符号开头,可以以字母和下划线开头:如<2name>不合法,而,<_2name>合法.

  (3)第一个字符之后可以有"-"".":如<.name>不合法,而<name.firstname>合法

  (4)不要使用冒号:因为这会与以后要说的命名空间冲突,所以<name:firstname>不合法.

  (5)最好不要用任何形式的xml开头,如<xml_name><Xml_name>就不行,因为一般的xml解析器对此有要求的.

  其实XML中规则也不是那么的多,就像我们当初学习任何一门语言,如C#,都有语法的要求,大家用多了就自然明白了,也不会在乎那么多.所以,xml也一样,大家看多了,自然就认为这些规则也熟悉.

  1.3 非法的字符

  在开始和结束标记之间的文本称为解析过的字符数据或者PCDATA,,可以在数据中使用除了"<"和"&"以外的任意字符,所以下面的例子:

  Code

<?xml version="1.0" ?>
<person>
<hello&
</person>

  把上面的文件保存为person.xml,然后用浏览器打开就会看见如下:

掌握XML系列(2)--创建格式良好的XML文档   

  因为在浏览器中有内置的解析器.可以检查XML文档格式良好

  1.4实体引用

  关于实体引用大家应该都熟悉的,因为在html也有,  

  & 的xml实体引用就是&amp; 举例:如果向在xml文档中显示 xiao&yang 那么就就要在编写xml文档时用xiao&amp;yang

  <的xml实体引用就是 &lt;

  >的xml实体引用就是&gt;

  '(单引号)xm实体引用是&apos;

  "(双引号)xml实体引用是&quto;

  注意:上面的一些字符,当你想在PCDATA中输入时,就要用他们饿实体引用

  注意PCDATA的概念  下面我们来练习上面的知识:

  加入你想在浏览器中显示下面的效果的(我的网络不是很好,插入代码很慢,所以是手写的,大家见谅):

  <?xml version="1.0"?>
  <person>
     <name>xiao&yang</name>
     <age><30</age>
     <address>"wuhan"</address>
  </person>

  那么你的xml文档就如下编写:

  <?xml version="1.0"?>
  <person>
     <name>xiao&amp;yang</name>
     <age>&lt;30</age>
     <address>&quto;wuhan">&quto;</address>
  </person>

  当然,那些实体是已经定义好了的,我们也可以定义自己的实体引用,称为通用实体.在DTD中,可以将实体定义为:

  <! ENTITY personal "this is my person identify ">

  然后你就可以在你的xml文档中引用自己定义的实体引用:

  <person>
     <mypersonal>&personal </mypersonal>
  </person>

  用浏览器看就是如下:

    <person>
     <mypersonal>this is my person identify </mypersonal>
  </person>

  今天就到这里吧,讲的有点多,希望大家可以接受,下一篇接着讲.谢谢大家的关注!