XML和XHTML
XML与XHTML
可扩展标记语言(也称为XML)是一组规则。这些规则特定于电子编码的文档。 XML的主要目标是强调互联网的简单性,通用性和可用性。 XML被视为一种文本数据格式,支持Unicode,可以轻松读取所有语言。虽然XML设计的主要目标是专门关注文档,但它通常也用于表示任意数据结构(例如Web服务)。实际上,开发人员可以使用大量编程接口来访问XML数据。还有各种架构系统专门用于帮助定义基于XML的语言。
可扩展超文本标记语言(也称为XHTML)是XML标记语言系列的一部分。它实际上模拟或简单地充当超文本标记语言(或HTML)的扩展。 XHTML充当XML系列的应用程序,是SGML的一个限制性更强的子集。由于XHTML文档格式良好,因此可以使用XML解析器对其进行解析 - 这进一步将XHTML与HTML区分开来。
XML文档完全由Unicode中的字符组成。有一些控制字符被排除在Unicode之外;但是,在Unicode中找到的那些能够成为XML文档中的内容。有许多工具可以识别XML文档中Unicode字符的编码。还有一些设施可以表达那些无法使用的角色。 Unicode被编码为字节以便存储或传输 - 这些翻译的Unicode表达式称为编码。 XML使用任何(如果不是全部)Unicode定义的编码,以及许多不同的编码,其字符以Unicode出现。它提供了一种机制,允许XML处理器确定正在使用哪种编码。
XHTML有三个特定版本:XHTML 1.0 Strict,其中包含HTML 4.01中未标记为已弃用的元素和特征; XHTML 1.0 Transitional,包括特定于演示文稿的元素(例如'font'和'strike');和XHTML 1.0 Frameset,它允许定义框架集文档。 XHTML也可以模块化,它提供了XHTML能够进行子集化和扩展的属性的抽象集合。这只是一种帮助XHTML将其范围扩展到其他知名平台(例如移动设备和支持Web的电视)的手段。
摘要:
1. XML是为编码文档而设置的一组规则; XHTML是HTML的XML等价物,是SGML的一个限制性更强的子集。
2. XML完全由Unicode组成; XHTML有三个版本:XHTML 1.0 Strict,XHTML 1.0 Transitional和XHTML 1.0 Frameset。