更新時間:2022-05-25 10:28:16 來源:動力節點 瀏覽1064次
XML(可擴展標記語言)用于描述數據。XML 標準是一種通過公共互聯網以及企業網絡創建信息格式和以電子方式共享結構化數據的靈活方式。
XML 是一種基于標準通用標記語言 ( SGML ) 的標記語言,用于定義標記語言。
XML 的主要功能是為用于對文檔、數據庫記錄、事務和許多其他類型數據的信息進行編碼的數據創建格式。XML 數據可用于創建不同的內容類型,這些內容類型是通過構建基于 XML 數據的不同類型的內容(包括 Web、印刷和移動內容)而生成的。
與同樣基于 SGML 標準的超文本標記語言 ( HTML ) 一樣,XML 文檔存儲為美國信息交換標準代碼 ( ASCII ) 文件,并且可以使用任何文本編輯器進行編輯。
根據萬維網聯盟(W3C) 的說法, XML 的主要功能是提供“用于表示結構化信息的簡單的基于文本的格式” ,包括以下內容:
Microsoft Office 等應用程序的基礎數據格式;
技術文檔;
應用軟件的配置選項;
圖書;
交易;和
發票。
XML 允許在以下對象之間共享結構化信息:
程序和程序;
程序和人員;和
本地和跨網絡。
W3C 定義了 XML 標準并建議將其用于 Web 內容。雖然 XML 和 HTML 都基于 SGML 平臺,但 W3C 還定義了 XHTML 和 XHTLM5 文檔格式,它們分別反映了 Web 內容的 HTML 和HTML5標準。
XML 通過提供可預測的數據格式來工作。XML 對格式有嚴格要求;如果格式關閉,處理或顯示編碼數據的程序將返回錯誤。
要使 XML 文檔被認為是格式良好的(即符合 XML語法并能夠被 XML 解析器讀取和理解),它必須是有效的 XML 代碼。所有 XML 文檔都由元素組成;元素充當數據的容器。元素的開始和結束由開始和結束標記標識,其中包含其他元素或純數據。
XML 通過提供格式正確的數據來工作,這些數據可以被設計用于處理 XML 輸入的程序可靠地處理。例如,技術文檔可能包含一個元素,類似于以下 XML 代碼片段中所示的元素:
<warning>
<para>
<emphasis type="bold">可能導致嚴重傷害</emphasis>
請格外小心,因為如果不采取預防措施,此過程可能會導致嚴重傷害或死亡。
</para>
</警告>
在此示例中,根據技術文檔的形式,以不同方式解釋和顯示此數據。在網頁上,此元素可以通過以下方式顯示:
相同的 XML 代碼在設備用戶界面 (UI) 或打印中呈現不同的方式。該元素可以解釋為以不同方式顯示標記為強調的文本,例如使其顯示為紅色并帶有閃爍的高亮顯示。在印刷形式中,內容可能以不同的字體和格式提供。
XML 文檔不定義表示,并且沒有默認的 XML 標記。大多數 XML 應用程序使用不同的預定義標記集,具體取決于 XML 格式。大多數用戶依賴預定義的 XML 格式來編寫他們的文檔,但用戶也可以根據需要定義額外的 XML 元素。
以下是一個簡單 XML 文件的示例:
<?xml version="1.0" encoding="UTF-8"?>
<library>
<book>
<title>The Fire Next Time</title>
<author>Baldwin, James</author>
</book>
<book >
<title>摯愛</title>
<author>莫里斯,托尼</author>
</book>
<book>
<title>斯德哥爾摩的彌賽亞</title>
<author>奧齊克,辛西婭</author>
</book >
</庫>
此示例中的第一行稱為XML 序言或XML 聲明,指定正在使用的 XML 版本以及字符編碼方案。此聲明(如果存在)必須是文件的第一行。
序言指定文件包含 XML 版本 1.0 數據,使用 Unicode 轉換格式 8 (UTF-8) 編碼進行編碼,與 ASCII 文本相同,并指定美式英語字符集。不同的語言字符集可以使用不同的字符編碼,但所有 XML 文件都必須由Unicode字符組成。任何 Unicode 字符都可以在 XML 文件中使用帶有以下格式的字符串的數字字符引用來表示:
&#xXXXX;
在此格式中,字母“XXXX”將替換為有效的十六進制Unicode 數字代碼。
XML 文件的邏輯結構要求文件中的所有數據都封裝在稱為根元素或文檔元素的 XML 元素中。該元素標識文件中包含的數據類型;在上面的示例中,根元素是<library>。
根元素包含定義 XML 文檔不同部分的其他元素;在上面的示例中,根元素包含<book>元素,而這些元素又由<title>和<author>兩個元素組成。
所有 XML 元素都必須正確終止,以便將 XML 文件視為格式正確。這意味著必須使用開始和結束標記正確終止標記,例如將成為文檔一部分的段落元素:
<para>這是一個段落的 XML 標記示例。</para>
標記也可以為空,在這種情況下,它以正斜杠終止。在這個例子中,一個空的自終止段落標簽用于在文檔中插入一個額外的空間:
<para />
XML 使用戶能夠在需要時定義自己的附加元素。在前面的示例中,XML 作者可以為出版商、出版日期、國際標準書號和任何其他相關數據定義新元素。還可以定義元素以強制執行有關元素內容的規則。
XML 不是一種編程語言。但是,作為一種標記語言,它用于使用標簽來注釋數據,標簽解釋該數據。編程語言由實現算法的指令組成,而標記語言用于格式化數據,以供運行解釋標記數據的算法的程序處理。
標記語言標簽被認為是一種計算機代碼,因為它們定義了標記語言的不同元素,并且對于如何組合這些元素有嚴格的語法規則。
XML 文件是具有 .xml 文件擴展名的純文本文件。XML 文件包含 Unicode 文本,可以使用任何能夠讀取文本文件的應用程序打開它們。
XML 文件可以使用簡單的文本編輯器或專門的 XML 編輯器進行編輯。XML 編輯器可能包括用于驗證 XML 代碼的工具,包括執行以下操作的能力:
解析 XML 代碼并顯示格式良好的 XML;
標記孤立文本,即未包含在標簽內的文本;和
識別格式不正確的標簽。
可以將不同類型的內容合并到 XML 文件中。例如,可以通過標識富媒體內容所在文件的標簽將富媒體內容合并到 XML 中。
0基礎 0學費 15天面授
有基礎 直達就業
業余時間 高薪轉行
工作1~3年,加薪神器
工作3~5年,晉升架構
提交申請后,顧問老師會電話與您溝通安排學習