<< Chapter < Page Chapter >> Page >
This module describes XML (eXtensible Markup Language) and the rules that govern its usage. It also explains what a well-formed and valid document is.

This module contains Connexions documentation which is out-of-date. The contents of this module are provided here for historical purposes only and should not be considered accurate for the current version of the Connexions website. The current (English-language) version of this module can be located at (External Link) . If you have any additional questions or cannot find the answer to your question, please contact techsupport@cnx.org and we will be happy to assist in any way we can.

If you would like to assist Connexions by helping us update this module with an appropriate translation from the current English version, please contact us at cnx@cnx.org as we would appreciate your help with improving our support for non-English-speaking users.

Xmlとは

  XML (eXtensible Markup Language)は、 World Wide Web Consortium(W3C) によって定義されたメタマークアップ言語です。厳密に言えば、それ自身はマークアップ言語ではなく、むしろマークアップ言語を生成するルールの集まりのようなものです。私たちの目的のために、 マークアップ言語 は、情報伝達のためにテキストをタグで囲む言語(例えばHTML)です。 Connexionsプロジェクト で使用されているマークアップ言語、 CNXML はXMLで書かれた言語の1つの例です。 他の多くの例がW3Cのサイトにあります。CNXMLの記述例です。

<para>This is a paragraph in<term>CNXML</term>. Notice that the markup contains tags that express the meaning of the text.</para>

  <para> </para> がテキストを含んでいるタグです。XMLでは、タグは < > で記述されます。普通 タグ はペアになります。開始のタグが <tagname> のようになり、終了のタグが </tagname> のようになります。

 XMLでは、コンテンツからプレゼンテーションを分離することができます。例えば、HTMLには <u> <i> などのタグがあります。前者はテキストにアンダーラインを付け、後者はテキストをイタリック体にします。これはフォーマットしているだけであり、コンテンツを説明してはいません。XMLではコンテンツの内容を表すため、あなたの好きなタグのタイトルを定義することができます。例えば本のタイトルを表すために、 <book> というタグを作成することができます。そしてスタイルシートでイタリック体にしたり、アンダーラインを引いたりできます。そして、そのタイプのコンテンツのプレゼンテーションを変更したい時、スタイルシートの1箇所を変更するだけで行うことができます。また、ドキュメントの中身を伝えるタグを作成するなら、探すよりいい方法があります。例えば、Authorタグを見ることによって、ドキュメントのAuthorを探すかもしれません。

Well-formed xml

 XMLには、CNXMLを含むすべての言語に適用されるいつくかのルールがあります。ドキュメントがこれらのルールを満たすなら、きちんと形成されてると言えます。XMLドキュメントはきとんと形成されていなければなりません。

  • 開かれたすべてのタグは閉じられなければなりません。 <module> で始まり、 </module> で終わるように。簡単な方法があります。タグが他のタグを含まないなら、開始のタグの「>」の前に「/」を入力することで、終了のタグを削除することができます。例えば、 <media> </media> <media/> と簡略化することができます。
  • タグは互いに入れ子になっていなくてはなりません。 <b>red<i>and</i>blue</b> は正しくて、 <b>red<i>and</b>blue</i> は正しくありません。なぜなら後者は入れ子になっていないからです。
  • 属性値には、シングルコーテーションかダブルコーテーションを付けなければなりません。 属性 はタグに関連している情報です。例えば、 <module id="m0001"> は正しくて <module id=m0001> は正しくありません。
  • また、すべてのドキュメントを XML宣言 ではじめることを選択することができます。XML宣言を使用するなら、それはファイルの最初で行わなければいけません。前に空白も入れてはいけません。それはタグではありません。XML宣言は以下の通りです。 <?xml version="1.0"?> ドキュメントのエンコードや、他のファイルを読み込むかどうかなどの別の情報も含めることができます。
  • すべてのタグを含む1つのタグがあるはずです。例えば、XHTMLでは <html> </html> は他のすべてのタグを囲まなくてはなりません。ドキュメントの最初にあり、タグで含まれていないものもあります。XML宣言はその例です。

Valid xml

 特定のXML言語のタグに適応されるルールを定義することは可能です。これらのルールは異なった方法で定義することができます。もっとも一般的な方法は DTD (Document Type Definition)を使用することです。その言語のルールに従う全てのドキュメントは、 有効 であると言えます。ドキュメントは有効なXMLになる必要はありませんが、一般的にそれはいい考えです。

Entities

  entity は拡張文字を表示するためのものです。それには基本的なフォームがあります。アンパーサンドで始まり、セミコロンで終わります。例えば&amp;は&という文字を表示するためのものです。もしソースファイルに&amp;と入力すると、ブラウザでは&が表示されます。これにはさまざまな種類があり、全てのXMLファイルで使えます。例えば&amp;(&)、&lt(<)、&gt(>)、&quot(")、&apos(')などです。これらはHTMLで定義されているものと同じです。これらの基本記号に加えて、DTDを使用することにより、自分自身の記号を定義することができます。これらの定義は他のシンボルを示したり、長いテキストへのショートカットとして利用できます。

  Unicode の文字もまたXMLに記述することができます。Unicodeは全ての言語の全ての文字のための、ユニークなコードを定義するためのプロジェクトです。UnicodeはASCIIの一部ではないシンボルを使用するとき、とても役に立ちます。

 Unicodeのentityには、#があります。したがって&#134;のようになります。もしくはコードが16真数で書かれているなら、&#x03C0;のようにxがつきます。

Get Jobilize Job Search Mobile App in your pocket Now!

Get it on Google Play Download on the App Store Now




Source:  OpenStax, Connexions tutorial and reference (japanese version). OpenStax CNX. Aug 26, 2005 Download for free at http://cnx.org/content/col10298/1.9
Google Play and the Google Play logo are trademarks of Google Inc.

Notification Switch

Would you like to follow the 'Connexions tutorial and reference (japanese version)' conversation and receive update notifications?

Ask