HTML4.01の基礎知識

Contents

  1. HTMLとは
  2. 要素と属性
  3. DTD
  4. ブロックレベル要素とインライン要素
  5. 特別な文字の表記:文字参照
  6. コメント
  7. 言語コード
  8. MIMEタイプ
  9. 文字コードセット
  10. ターゲット名
  11. パス
  12. 拡張子
  13. URL

HTMLとは

HTMLとは
Hypertext Markup Languageの略。Hypertextとは,ハイパーリンクによって関連する複数のページがリンクされて一つの文書を成しているものを指す概念。Markup Languageとは,テキスト内にタグを埋め込むことで論理構造を作る言語。

要素と属性

HTMLとは本来、文書を「見出し」や「本文」などの構成要素に分類し、タグをつけてその構造を明確に示すものです。そして、その構成要素の性質を決定するのが属性です。

【例】 <P align="center">文章</P>
タグ(tag)
上の例では「<P>」と「</P>」の部分を指します。
要素(element)
上の例では「<P align="center">文章</P>」の部分を指します。
内容(content)
上の例では「文章」の部分を指します。
属性(attribute)
上の例では「align="center"」の部分を指します。

DTD

SGML(Standard Generalized Markup Language)によって定義されたマークアップ言語をSGMLアプリケーションと言います。HTMLはSGMLアプリケーションです。SGMLアプリケーションは、DTD(Document Type Definition)により、要素や属性の名前、その親子関係や出現順序、出現回数などを定義されます。HTML4.01では、次の3種類のDTDが存在します。

完全DTD(Strict DTD)
廃止予定の要素や属性とフレーム関連を全て除いたDTDです。 http://www.w3.org/TR/html4/strict.dtd
過渡期用DTD(Transitional DTD)
フレーム関連を除いて、廃止予定の要素や属性を含むDTDです。 http://www.w3.org/TR/html4/loose.dtd
フレームDTD(Frameset DTD)
フレーム関連と廃止予定の要素や属性を全て含むDTDです。 http://www.w3.org/TR/html4/frameset.dtds
使用するDTDを指定するには、文書の先頭でDOCTYPE宣言を行います。具体的には、以下のDOCTYPE宣言を文書の先頭に記述して示します。
完全DTD(Strict DTD)
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
過渡期用DTD(Transitional DTD)
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
フレームDTD(Frameset DTD)
<!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">

ブロックレベル要素とインライン要素

BODY要素内に記述するほとんどの要素は、ブロックレベル要素とインライン要素に分類することが出来ます。

ブロックレベル要素
ADDRESS, BLOCKQUOTE, CENTER, DIR, DIV, DL, FIELDSET, FORM, H1~H6, HR, ISINDEX, MENU, NOFRAMES, NOSCRIPT, OL, P, PRE, TABLE, UL
インライン要素
A, ABBR, ACRONYM, APPLET, B, BASEFONT, BDO, BIG, BR, BUTTON, CITE, CODE, DFN, EM, FONT, I, IFRAME, IMG, INPUT, KBD, LABEL, MAP, OBJECT, Q, S, SAMP, SCRIPT, SELECT, SMALL, SPAN, TT, U, VAR

ブロックレベル要素は、他のブロックレベル要素やインライン要素を含むことが出来ます。BODY要素内に直接配置出来るのはブロックレベル要素で、インライン要素は必ずそのなかに含めて配置する必要があります。

特別な文字の表記:文字参照

&lt;
「<」を表示
&gt;
「>」を表示
&amp;
「&」を表示
&quot;
「"」を表示

詳しくは、24 Character entity references in HTML 4をご覧下さい。

コメント

HTMLでのコメントは以下のように記述します。

<!-- この部分がコメント -->

コメントの開始を示す部分の「<!」と「--」の間には、空白文字を入れずに必ず続けて記述します。但し、終了を示す部分の「--」と「>」の間には空白文字を含むことが出来ます。

言語コード

lang属性は、ISO-639標準である2文字言語コードに設定します。ISOの言語コードの後ろにダッシュ(-)を付けてサブコードを続ければ、地域を指定することもできます。例えば、"en"は英語を表すISOの言語コードですが、"en-US"はアメリカ英語を示す完全コードです。他の一般的な言語コードには"fr"(フランス語)、"de"(ドイツ語)、"it"(イタリア語)、"nl"(オランダ語)、"el"(ギリシャ語)、"es"(スペイン語)、"pt"(ポルトガル語)、"ar"(アラビア語)、"he"(ヘブライ語)、"ru"(ロシア語)、"zh"(中国語)、"ja"(日本語)、"hi"(ヒンズー語)などがあります。

【例】 <HTML lang="ja">

MIMEタイプ

「text/html」「image/png」「image/gif」「text/javascript」「text/css」などのMIMEタイプを指定します。このMIMEタイプには、正式には「メディアタイプ」(RFC2045)と呼ばれていますが、HTML4.01の仕様では出力媒体の種類を表す「メディアタイプ」と混同しないように「コンテント・タイプ」と表現されています。MIMEタイプの指定では大文字と小文字は区別されません。

文字コードセット

IANAに登録されている文字コードセットを指定します。JISの場合は「iso-2022-jp」、シフトJISの場合は「Shift_JIS」、EUCの場合は「EUC-JP」、US ASCIIの場合は「us-ascii」を指定します。文字コードセットの指定では大文字と小文字は区別されません。A・LINK要素のcharset属性でリンク先の文字コードセットを指定する場合などに使用されます。

【例】 <META http-equiv="Content-Type" content="text/html;charset=Shift_JIS">
<META http-equiv="Content-Style-Type" content="text/css">

ターゲット名

文書の表示先であるターゲット名には、アルファベットから始まる名前を指定します。そうでない場合には、ブラウザに無視されることになっています。但し、以下に示す4つのターゲット名は特別で、それぞれ次のような意味があります。

パス

パス
コンピュータ内のファイルの所在地を表す住所のようなもの。例えば,エクスプローラー画像の右側の画面に表示されているAcrobat.pdfのパスは
C:\Acrobat3\Reader\Acrobat.pdf
となる。ここで,C:はドライブ名で,Acrobat3,Readerはフォルダ(コンピュータ内の区画)である。
絶対パス
絶対的な位置関係を示すパスのこと。例えば、エクスプローラー画像での
C:\Acrobat3\Reader\Acrobat.pdf
は絶対パスである。又、この絶対パスをUNIX風に直すと次のようになる。
/Acrobat3/Reader/Acrobat.pdf
UNIXではドライブという概念がない(を必要としない)為、絶対パスの先頭は常に/となる。
相対パス
相対的な位置関係を示すパスのこと。カレントディレクトリ(現時点のディレクトリ)に対して、..(上位階層), .(カレントディレクトリ), /(ディレクトリの区切り、又はルートディレクトリ)などで相対関係を示す。 例えば、エクスプローラー画像の例でカレントディレクトリがC:\Acrobat3\Readerだった場合、C:\Acrobat3\Reader内のファイルFillRdMeJ.txtを示す相対パスは、そのままFillRdMeJ.txtとなる。また、C:\Acrobat3\test.htmlを示す相対パスは、上位の階層のディレクトリを指す..を使い、../test.htmlとなる。下位階層内のファイル、例えばC:\Acrobat3\Reader\ActiveX\test.gifを示す相対パスは、ActiveX/test.gifとなる。いずれの場合にしても、.はカレントディレクトリを表す為、それぞれ./FillRdMeJ.txt, ./../test.html, ./ActiveX/test.gifでも同じ相対パスを表す。

拡張子

拡張子
ファイル名の最後の文字から.までの文字を拡張子という。例えば、この文書のファイル名term.htmlの拡張子はhtmlであり、HTMLファイルと呼ぶ。拡張子により、ファイルの種類の区別が可能になる。インターネット上でよく使われる拡張子は、htmlとhtm(HTML)の他に、jpg(JPEG), gif)GIF), wav(WAVE), mid(MIDI), ra(Real Audio)pdf(PDF), zip(ZIP), lzh(LZH)などがある。
拡張子によるアプリケーションの関連付けは、マイコンピュータ→ツール→フォルダオプション→ファイルの種類で登録されている。

URL

URL
Uniform Resource Locatorの略。RFC1738で定義されている。例えば、http://www.komazawa-u.ac.jp/~w3c/lecture/html/term.htmlのように、プロトコル名(http://)、サーバー名(www.komazawa-u.ac.jp)=ホスト名(www)+ドメイン名(komazawa-u.ac.jp)、ディレクトリ名(w3c、lecture、html)、ファイル名(term.html)などの形で書かれる。
また、index.html, index.htmはディレクトリを指定した場合に自動的に読み込まれる為、http://www.komazawa-u.ac.jp/~w3c/lecture/html/のようにURLを指定すると、http://www.komazawa-u.ac.jp/~w3c/lecture/html/index.htmlが表示される。
DNS
DNS(Domain Name System)により、ドメイン名はIPアドレスに変換される。
DNSは、ホスト名(例えば"www.komazawa-u.ac.jp")の入力があるとDNSサーバ と呼ばれるコンピュータを参照し、そのホストのもつ IP アドレス(例えば"203.180.68.72")に接続するシステムである。例えるなら、DNSは氏名から電話番号を自動で調べる電話帳のようなものである。

HTMLに戻る