HTML 是Web 统一语言,这些容纳在尖括号里的简单标签,构成了如今的 Web。1991 年,Tim Berners-Lee 编写了一份叫做 “HTML 标签”的文档,里面包含了大约20个用来标记网页的 HTML 标签。他直接借用 SGML 的标记格式,也就是后来我们看到的 HTML 标记的格式。本文讲述了 HTML 这门 Web 标记语言的发展简史。
从 IETF 到 W3C: HTML 4 之路
HTML 1 并不曾存在,HTML 的第一个官方版本就是由 IETF (互联网工程任务组) 推出的 HTML 2.0。问世之前,这个版本中的很多细则已经被实现,比如,1994年的 Mosaic 浏览器已经实现了在文档中嵌入图片的方法,后来 HTML 2.0 便吸纳了 img 这个标签。
后来,W3C 取代 IETF 的角色,成为 HTML 的标准组织,1990年代的后半页,HTML 的版本被频繁修改,直到1999年的 HTML 4.01,至此,HTML 到达了它的第一个拐点。
XHTML 1: XML 风格的 HTML
HTML 在 HTML 4.01 之后的第一个修订版本就是 XHTML 1.0,其中 X 代表 “eXtensible” ,扩展,当然也有人将之解读为 “eXtreme”,极端。XHTML 1.0 是基于 HTML 4.01 的,并没有引入任何新标签或属性,唯一的区别是语法,HTML 对语法比较随便,而 XHTML 则要求 XML 般的严格语法。
使用严格的语法规范并非坏事,要求开发者使用单一的代码风格,比如,HTML 4.01 允许你使用大写或小写字母标识标记元素和属性,XHTML 则只允许小写字母。XHTML 1.0 的推出刚好碰上了 CSS 的崛起,Web 开发设计者们开始意识到 Web 标准问题,基于 XHTML 的严格语法规范被视为编写 HTML 代码的最佳实践。
于是,W3C 推出 XHTML 1.1。
如果说 XHTML 1.0 是 XML 风格的 HTML,XHTML 1.1 则是货真价实的 XML。这意味着 XHTML 1.1 无法使用 text/html mime-type 直接输出,然而,如果 Web 开发者使用 XML mime-type,则当时的主流浏览器,IE 则压根不支持。看上去,W3C 似乎正在与当时的 Web 脱节。
出力不讨好的 XHTML 2
对 W3C 而言,到了 HTML 4 已经是功德圆满,他们的下一步工作是 XHTML 2,希望将 Web 带向 XML 的光明未来。虽然 XHTML 2 听上去和 XHTML 1 类似,它们却有很多差别,XHTML 2 不向前兼容,甚至不兼容之前的 HTML。它是一种全新的语言,赤条条来去无牵挂。这实在是一场灾难。
WHATWG:与 W3C 决裂
W3C 闭门造车的作风引起了一些人的不满,来自 Opera, Apple, 以及 Mozilla 的代表开始表达反对声音。2004年,Opera 的 Ian Hickson 提议在 HTML 基础上进行扩展以适应新的 Web 应用,该提议遭到 W3C 的拒绝。于是,他们自发组织成立了超文本应用技术工作组,就是 WHATWG。