百科解釋
目錄·發(fā)展歷史·標準的版本歷史·標記元素類型·文件類型描述·分離樣式和內(nèi)容·使用HTTP發(fā)布HTML·HTML格式的電子郵件·HTML超文本格式 一段用彩色標示的HTML源代碼 超文本置標語言(英文:HyperText Markup Language,簡稱為HTML)是為網(wǎng)頁創(chuàng)建和其它可在網(wǎng)頁瀏覽器中看到的信息設(shè)計的一種置標語言。HTML被用來結(jié)構(gòu)化信息——例如標題、段落和列表等等,也可用來在一定程度上描述文檔的外觀和語義。由蒂姆·伯納斯-李給出原始定義,由IETF用簡化的SGML(標準通用置標語言)語法進行進一步發(fā)展的HTML后來成為國際標準,由萬維網(wǎng)聯(lián)盟(W3C)維護。 包含HTML內(nèi)容的文件最常用的擴展名是<tt>.html</tt>,但是像DOS這樣的舊操作系統(tǒng)限制擴展名為最多3個字符,所以<tt>.htm</tt>擴展名也被使用。雖然現(xiàn)在使用的比較少一些了,但是<tt>.htm</tt>擴展名仍舊普遍被支持。編者可以用任何文本編輯器或所見即所得的HTML編輯器來編輯HTML文件。 早期的HTML語法被定義成較松散的規(guī)則,以有助于不熟悉網(wǎng)絡(luò)出版的人采用。網(wǎng)頁瀏覽器接受了這個現(xiàn)實,并且可以顯示語法不嚴格的網(wǎng)頁。隨著時間的流逝,官方標準漸漸趨于嚴格的語法,但是瀏覽器繼續(xù)顯示一些遠稱不上合乎標準的HTML。使用XML的嚴格規(guī)則的XHTML(可擴展超文本置標語言)是W3C計劃中的HTML的接替者。雖然很多人認為它已經(jīng)成為當前的HTML標準,但是它實際上是一個獨立的、和HTML平行發(fā)展的標準。W3C目前的建議是使用XHTML 1.1、 XHTML 1.0或者HTML 4.01進行網(wǎng)絡(luò)出版。 發(fā)展歷史 1982 年,Tim Berners-Lee 為使世界各地的物理學家能夠方便的進行合作研究,建立了使用于其系統(tǒng)的 HTML。Tim Berners-Lee 設(shè)計的 HTML 以純文字格式為基礎(chǔ),可以任何文字編輯器處理,最初僅有少量標記(TAG)而易于掌握運用。隨著 HTML 使用率的增加,人們不滿足只能看到文字。1993 年,還是大學生的 Marc Andreessen 在他的 Mosaic 瀏覽器加入 <img> 標記,從此可以在 Web 頁面上瀏覽圖片。但人們認為僅有圖片還是不夠,希望可將任何形式的媒體加到網(wǎng)頁上。因此 HTML 不斷地擴充和發(fā)展。 標準的版本歷史 HTML 超文本置標語言(第一版)——在1993年6月發(fā)為互聯(lián)網(wǎng)工程工作小組 (IETF)工作草案發(fā)布(并非標準). HTML 2.0——1995年11月作為RFC 1866發(fā)布,在RFC 2854于2000年6月發(fā)布之后被宣布已經(jīng)過時 HTML 3.2——1996年1月14日,W3C推薦標準 HTML 4.0——1997年12月18日,W3C推薦標準 HTML 4.01(微小改進)——1999年12月24日,W3C推薦標準 ISO/IEC 15445:2000(“ISO HTML”)——2000年5月15日發(fā)布,基于嚴格的HTML 4.01語法,是國際標準化組織和國際電工委員會的標準。 HTML沒有1.0版本是因為當時有很多不同的版本。有些人認為蒂姆·伯納斯-李的版本應該算初版,這個版本沒有IMG元素。當時被稱為HTML+的后續(xù)版的開發(fā)工作于1993年開始,最初是被設(shè)計成為“HTML的一個超集”。第一個正式規(guī)范在為了和當時的各種HTML標準區(qū)分開來,使用了2.0作為其版本號。HTML+的發(fā)展繼續(xù)下去,但是它從未成為標準。 HTML3.0規(guī)范是由當時剛成立的W3C于1995年3月提出,提供了很多新的特性,例如表格、文字繞排和復雜數(shù)學元素的顯示。雖然它是被設(shè)計用來兼容2.0版本的,但是實現(xiàn)這個標準的工作在當時過于復雜,在草案于1995年9月過期時,標準開發(fā)也因為缺乏瀏覽器支持而中止了。3.1版從未被正式提出,而下一個被提出的版本是開發(fā)代號為Wilbur的HTML 3.2,去掉了大部分3.0中的新特性,但是加入了很多特定瀏覽器,例如Netscape和Mosaic的元素和屬性。HTML對數(shù)學公式的支持最后成為另外一個標準MathML。 HTML 4.0同樣也加入了很多特定瀏覽器的元素和屬性,但是同時也開始“清理”這個標準,把一些元素和屬性標記為過時的,建議不再使用它們。HTML的未來和CSS結(jié)合會更好。 HTML 5目前仍為草案,并已被W3C接納。 XHTML 主條目:XHTML XHTML 1.0——發(fā)布于2000年1月26日,是W3C推薦標準,后來經(jīng)過修訂于2002年8月1日重新發(fā)布。 XHTML 1.1, 于2001年5月31日發(fā)布。 XHTML 2.0, W3C工作草案。 XHTML 5,從XHTML 1.x的更新版,基于HTML 5草案。 標記元素類型 以下是HTML元素的類型: 結(jié)構(gòu)性 標記,描述文字的意圖,例如 指明瀏覽器將"Golf"顯示為二級標題。結(jié)構(gòu)性標記并未指示瀏覽器的顯示方式,但是大多數(shù)瀏覽器標準化了這些元素的顯示,例如默認情況下上述的標題會被顯示為較大的粗體文字。參見層疊樣式表 (CSS)。比較常用的結(jié)構(gòu)性標記有: html元素 標記HTML內(nèi)容的開始和結(jié)束。 head元素 標記HTML文件頭,包含不在正文中顯示的關(guān)鍵字、標題、腳本等等。 title元素 標記HTML文件的標題。 body元素 標記HTML文件正文的開始和結(jié)束。 呈現(xiàn)性標記。描述文字的外觀,例如 將"boldface"顯示為粗體文字。但是為了統(tǒng)一網(wǎng)站的風格,很多網(wǎng)絡(luò)出版者使用CSS而不是重復使用呈現(xiàn)性標記。對于<code><b>bold</b></code>和<code><i>italic</i></code>,也有通常更加明確的等價呈現(xiàn)性標記,例如<code><strong>strong emphasis</strong></code>和<code><em>emphasis</em></code>。</dd> 超文本標記。將文檔的一部分關(guān)聯(lián)到其他文檔。例如 <code><a href="http://wikipedia.org/">Wikipedia</a></code> <dd>將會把Wikipedia顯示為一個超鏈接URL。 除了HTML內(nèi)容之外,經(jīng)常也有人在代碼中加入注釋: code><!-- This is a comment --></code> 注釋不被瀏覽器解釋,僅僅起到說明代碼含義或者隱藏部分代碼的作用。 框架頁面標記。描述網(wǎng)頁如何顯示框架網(wǎng)頁,較低版本的瀏覽器并不支援此功能。 code><frameset> </frameset></code> 代表定義一個框架。若在<code>後加上rows="100,*"</code>,這代表網(wǎng)頁會開啟一個上下分割網(wǎng)頁的框架,而上框架網(wǎng)頁的高度是100px。. 加上cols="100,*"代表網(wǎng)頁左右分割,左框架的網(wǎng)頁闊度是100px。 code><framename="left" src="left.html" /> 代表框架頁的名稱及檔案來源。這個語法是加在<code></frameset></code>前。 每個標記都有特定的屬性。由于對標準的支持度相差很大,一些標記和屬性可能只被部分瀏覽器支持。 文件類型描述 為了指明文檔使用的HTML標準,所有HTML文檔應該以文件類型聲明(DOCTYPE)開頭,引用一個文件類型描述。舉例來說: <!DOCTYPE html PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd"> 這個聲明斷言文檔服從HTML 4.01的嚴格文件類型描述,這個標準是嚴格結(jié)構(gòu)化的,使用CSS來做格式化。有時是否存在一個合適的文件類型描述會影響一個瀏覽器顯示網(wǎng)頁的方式。 除了HTML 4.01的嚴格文件類型描述之外,HTML 4.01也提供過渡和框架集文件類型描述。過渡文件類型描述是向嚴格的文件類型描述過渡的緩沖,而框架集文件類型描述則針對包含框架元素的網(wǎng)頁。 分離樣式和內(nèi)容 網(wǎng)絡(luò)開發(fā)社區(qū)的努力導致一種新的網(wǎng)頁編寫潮流,XHTML就是一個典型。標準著重于描述網(wǎng)頁結(jié)構(gòu)的元素,例如標題、段落、引言和表格,而不是那些用于呈現(xiàn)的元素,例如<font>、 <b> (粗體)和<i> (斜體)。在一些HTML變體中這些元素甚至被禁用,例如HTML 4.01 的嚴格版本。CSS提供了一種分離HTML結(jié)構(gòu)和內(nèi)容呈現(xiàn)的方式:把所有呈現(xiàn)代碼移到單獨的CSS文件。 使用HTTP發(fā)布HTML 萬維網(wǎng)主要由從服務(wù)器通過HTTP協(xié)議向瀏覽器發(fā)送的HTML文檔組成。但是,HTTP也可以被用于傳輸HTML之外的數(shù)據(jù),例如圖像、聲音和其他內(nèi)容。為使瀏覽器了解如何處理接收到的文檔,在傳輸文檔時必須同時傳遞文件類型。這種元數(shù)據(jù)包含MIME類型(對于HTML 4.01或更早版本是<tt>text/html</tt>,而對于XHTML 1.0或之后的版本是<tt>application/xhtml+xml</tt>),以及字符編碼(參見HTML字符編碼方式)。 在現(xiàn)在的瀏覽器中,和HTML文檔一起發(fā)送的MIME類型影響文檔的解讀方式。和XHTML MIME類型一起發(fā)送的文檔被認為是良構(gòu)的XML,而語法錯誤會導致瀏覽器無法呈現(xiàn)文檔。完全相同的文檔如果和HTML MIME類型一起發(fā)送,則可能被正常顯示,因為瀏覽器對HTML的語法檢查更加松懈些。 如果MIME類型不被識別為HTML,那么瀏覽器不應該試圖將文檔呈現(xiàn)為HTML,即使文檔以正確的文檔類型聲明開頭也是這樣;盡管如此,一些瀏覽器還是檢查文檔內(nèi)容或其URL來判斷其文件類型。因為可能造成的安全性問題,這種行為不被提倡。即使以不遵守標準著稱的Internet Explorer也基本放棄了這種做法。 HTML格式的電子郵件 一些圖形模式下的電子郵件客戶端支持HTML格式的郵件。很多支持一個圖形模式下的HTML郵件編輯器,以及一個HTML郵件閱覽器。因為一些問題,HTML郵件的使用有爭議。HTML郵件的主要優(yōu)點是可以使用呈現(xiàn)性元素來加強郵件的視覺效果,但是缺陷也很多,例如 收件人未必有一個可以瀏覽HTML郵件的客戶端 郵件大小增加。一些郵件客戶端隨HTML郵件發(fā)送一個純文字版更加重了這個問題 過度使用格式化 潛在安全問題,例如偽造銀行電子郵件用于網(wǎng)絡(luò)釣魚 在一些有缺陷的電子郵件程序顯示HTML郵件時可能執(zhí)行惡意代碼 因為這些原因,很多新聞組和郵件列表要么截斷信件的HTML部分,要么只接受純文本版本部分的郵件,要么拒絕接收HTML郵件。 HTML超文本格式 HTML是一個相對比較弱的超文本實現(xiàn)。早期超文本系統(tǒng)具有具有類型的鏈接、跨越包含和來源跟蹤這樣的屬性。另一個現(xiàn)在缺乏支持的特性是粗鏈路。 直到不久之前,一些早期HTML版本中的超文本特性一直被大多數(shù)瀏覽器忽略,例如link元素和可編輯的網(wǎng)頁。 有時網(wǎng)絡(luò)服務(wù)或者瀏覽器廠商也認識到這些特性。例如,現(xiàn)在的wiki和nuke社會網(wǎng)絡(luò)軟件允許瀏覽者編輯訪問的網(wǎng)頁。
移動通信網(wǎng) | 通信人才網(wǎng) | 更新日志 | 團隊博客 | 免責聲明 | 關(guān)于詞典 | 幫助