XML

XML 知识量:7 - 28 - 99

1.1 XML的历史><

标记语言- 1.1.1 -

标记语言就是用一系列约定好的标记对文档进行标注,实现对文档的语义、结构和格式的定义。标记语言要求不能有二义性,必须能够与内容区分且易于识别。例如:

我喜欢<重点>XML语言</重点>

其中,<重点>是起始标记,</重点>是结束标记。

通用标记语言- 1.1.2 -

为解决大量文档的交换和存储,IBM公司于20世纪60年代末发明了通用标记语言GML,后来经过完善发展成为SGML。SGML是一种通用的文档结构描述标记语言,为语法标记提供了强大的工具,具有良好的可扩展性,在数据分类和索引中非常有用。但其复杂度很高,不适合网络的日常应用。

超文本标记语言- 1.1.3 -

SGML语言是一种可以通过文档类型定义的规则集合来定义其他标记语言的元标记语言,HTML(HyperText Markup Language)即超文本标记语言,就是通过SGML定义出来的标记语言。HTML所有的控制标记都是固定的,且数量有限。HTML不允许网页设计者自行创造标记,因此,HTML不是一种元标记语言。

XML的诞生- 1.1.4 -

随着技术的发展,越来越需要建立存储大量电子文档的数据仓库,这里的电子文档需要具备以下特性:

  • 文档结构:提供如何书写文档的基本框架。

  • 文档内容:标记出文档所包含的内容。

  • 文档格式:指定文档在显示时的排列样式。

HTML具备文档内容和格式的特性,但不能指定文档的结构,因此不能满足数据仓库的要求,XML被创造出来。

XML是一种标记语言,写法上类似于HTML,属于SGML的子集,继承了SGML自定义标记的特点,功能上弥补了HTML标记的不足。XML没有HTML中的那些默认标记,而是由用户根据需要自定义各种标记。下面是一个示例:

<?xml version="1.0" encoding="UTF-8"?>
<people>
    <man>
        <name>Bob</name>
        <phone>16605654555</phone>
    </man>
    <man>
        <name>Jeff</name>
        <phone>15504562132</phone>
    </man>
</people>