频道直达 - 专题 - 新闻 - 技巧 - 组网 - 开发 - 安全 - web编程 - 图像 - 操作系统 - 数据库 - 教育 - 旅游 - 健康 - 时尚 - 驱动 - 软件 - 游戏 - 多媒体 - ERP - 讨论组

关于XHTML的简单理解

来源: 作者: 出处:巧巧读书 2006-09-21 进入讨论组

  使用HTML是可以制作出现代的、结构化的、兼容标准的站点的。然而,为了做到向整洁的语义化的代码的转变,并且为XML和未来的其他标记语言做好准备,建议大家使用XHTML1.0 Strict来创建新的站点,本文中的例子用的就是XHTML1.0 Strict。

  XHTML 1.0 是以XML 1.0对HTML 4的改进,它的发展,以用来代替HTML。XHTML 1.0 Strict(这是我一直所倡导的)不支持表现类的标记(HTML 4.01其实也不支持,但是现在我们讨论的是XHTML)。正因为此,XHTML1.0 Strict 就促使了表现与结构的分离。

  XHTML 1.1(XHTML的最新版)从技术上说,使用起来有一些复杂。因为规定中声明XHTML 1.1的文档应当使用MIME类型 application/xHTML+XML, 不应当被看作text/HTML。 并不是严格的禁止使用text/HTML, 只是不建议使用。 另外一方面,XHTML 1.0 (应当使用 application/xHTML+XML)同样可以使用MIME类型 text/HTML, 如果它是可兼容的HTML。W3C的注解XHTML Media Types 中包括了MIME类型(W3C推荐使用的类型)的概要。

  不幸的是,一些老的浏览器包括IE不能识别MIME类型 application/xHTML+XML, 并且会终止显示源代码,甚至会干脆拒绝显示整个文档。

  如果你想使用application/xHTML+XML, 你应当让服务器检验一下读取文档的浏览器是否支持MIME类型。

  如果你使用的是PHP作为服务器端的脚本,那么下面的这段脚本能够让你的文档针对不同的浏览器使用不同的MIME类型。

<?PHP if (stristr($_SERVER[HTTP_ACCEPT], "application/xHTML+XML") || stristr($_SERVER["HTTP_USER_AGENT"],"W3C_Validator"))
{ header("Content-Type: application/xHTML+XML; charset=iso-8859-1");
header("Vary: Accept");
echo("<?XML version=\"1.0\" encoding=\"iso-8859-1\"?>\n");
} else { header("Content-Type: text/HTML; charset=iso-8859-1");
header("Vary: Accept"); } ?>

  这个脚本是检测是否用户代理发送了一个包含“application/xHTML+XML”的Accept HTTP头,或者如果用户代理是W3C HTML校验器(不会发送合适的Accept HTTP头的,但是它依然支持 application/xHTML+XML)。如果上面检测的回答是肯定的,文本将被看作 application/xHTML+XML。那些浏览器也会收到一个XML的声明。对于另外的一些浏览器(包括IE的是所有版本),文档都将被看做 text/HTML。在文档中也没有添加额外的XML声明,因为如果添加的话,会使IE/WIN转化到我们所不希望的Quirks模式。

  在Content-Type头部之后,一个被更改过的头部,将被发送到中间的缓存中(比如一些代理服务器),用来告诉他们文档的内容类型随着客户端对文档的请求而改变。

  那个脚本对请求客户端的q-rating(它声明了更够很好的支持某种MIME类型)进行了考虑,在发送text/HTML 文档给不支持 application/xHTML+XML的客户端之前,把XHTML转化成HTML 4。

  下面的是一个相似的脚本,针对ASP(VBSscript):

<% If InStr(Request.ServerVariables("HTTP_ACCEPT"), "application/xHTML+XML") > 0 Or InStr(Request.ServerVariables("HTTP_USER_AGENT"), "W3C_Validator") > 0 Then Response.ContentType = "application/xHTML+XML" Response.Write("<?XML version=""1.0"" encoding=""iso-8859-1""?>" & VBCrLf); Else Response.ContentType = "text/HTML" End If Response.Charset = "iso-8859-1" %>

  值得注意的是,当一个文档的MIME type是application/xHTML+XML时,一些浏览器(像Mozilla)是不会显示包含错误的文档的。这在开发过程中是一件好事,但是对于那些刚刚更新完站点且不是XHTML专家的人来说,就会出现一些问题,除非您能确保所有的代码都是规范的。如果出现了这种问题,您可以考虑使用HTML 4.01 Strict来代替XHTML。

  下面列出了一些在使用XHTML 1.0 Strict中需要特别注意的地方:

  • 永远使用小写字母,让引号伴随者属性: 所有元素和属性的名字都必须使用小写,所有属性值必须使用双引号。

    错误: <A HREF="../../index.HTML" CLASS=internal>
    正确: <a href="../../index.HTML" class="internal">

  • 关闭所有的元素:在HTML中一些元素没有必要被关闭。当下一个元素开始的时候,上一个元素就自动被关闭。XHTML中是不允许这样的。所有元素都必须被关闭,即使其中没有内容(如 <img>)

    错误: <li>Item 1
    正确: <li>Item 1</li>

    错误: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.
    正确: <p>Lorem ipsum dolor sit amet, consectetuer adipiscing elit.</p>

    错误: <br>
    正确: <br />

    错误: <img src="../../image.jpg" alt="">
    正确: <img src="../../image.jpg" alt="" />

  • 属性不能被缩减: 在HTML里,一些属性可以被缩减。而XHTML则不允许这样做。

    错误: <input type="checkbox" id="checkbox1" name="checkbox1" checked>
    正确: <input type="checkbox" id="checkbox1" name="checkbox1" checked="checked" />

  • 不要使用被排斥的元素: 一些元素和属性在HTML 4.01 Transitional和XHTML 1.0 Transitional是被允许的,而在XHTML 1.0 Strict下则不被支持(还有in HTML 4.01 Strict)。比如<font>、<center>、 alink、align、width、 height (对于某些元素)和 background。

  Doctype(文档类型)

  现在只有很少的HTML文档有一个正确而完整的doctype或者DTD (文档类型声明)。它现在更多的是在起装饰作用而没有什么功能作用,但是就在几年前刚开始的时候,一个doctype的定义,对浏览器解释这个文档起到很大的作用。

  所有的HTML和XHTML文档都必须使它的doctype声明合法化。 doctype可以告诉我们在文档中使用的是什么版本的HTML和XHMTL,也决定了校验器以何种方式校验,浏览器以何种模式解释。如果文档中有一个正确而完整的doctype,许多浏览器将会转换到标准模式,那就意味着与CSS的规范更加接近了。因为浏览器不必再把时间用在弥补、解释不规范的HTML上了,所以文档的显示速度也加快了。这同样也会减少在不同浏览器上显示的差异性。

  下面的doctype声明是针对XHTML 1.0 Strict的,它将会促使拥有“文档类型转换器”的浏览器使用他们的标准模式。

<!DOCTYPE HTML PUBLIC "-//W3C//DTD XHTML 1.0 Strict//EN" "http://www.w3.org/TR/xHTML1/DTD/xHTML1-strict.dtd">

  字符编码

  所有的XHTML文档都应当定义他们的字符编码。

  最好的网页编码方法是配置你的网络服务器,使其发送带有字符编码的HTTP content-type头部。关于如何使用去做的具体细节,请参阅你所使服务器软件的说明。

  如果你使用的是Apache,你可以通过在你的.htaccess文件中添加一两条规则来定义字符编码。例如,你的所有文件使用的都是utf-8, 添加下面的语句:

  AddDefaultCharset utf-8

  定义具有相同扩展名的文件的字符编码,则使用下面的代码:

  AddCharset utf-8 .HTML

  如果你的服务器允许你用PHP脚本时,你可以使用以下的代码来定义字符编码。

<?PHP header("Content-Type: application/xHTML+XML; charset=utf-8"); ?>

  如果你的页面是HTML, 请把application/xHTML+XML换成 text/HTML。不管是什么原因,如果你不能配置你的服务器使其定义为你所使用的字符编码,你可以在<head>中使用<meta> 。即使你的服务器配置正确了,这也是个定义字符编码的好方法。

  例如, 下面的<meta>告诉浏览器这是一个使用ISO-8859-1字符编码的文档:

<meta http-equiv="content-type" content="text/HTML; charset=ISO-8859-1" />
保留地址 http://www.qqread.com/xhtml/d232729.html进入讨论组讨论。
收藏此文】【 】【打印】【关闭
相关图文阅读
频道图文推荐
健 康 咨 询
时 尚 咨 询
巧巧读书宗旨
相关专题
最新论坛文章
站内各频道最新更新文档
站内最新制作专题
热门关键字导读
Photoshop教 程照片处理 照片制作 PS快捷键 抠图
计 算 机 故 障XP系统修复
艺 术 与 设 计设计 流媒体 设计欣赏 边框
计 算 机 安 全ARP
站内频道文章精选
巧巧电脑频道编辑信箱  告诉我们您想看的专题或文章