HTML4.01の基礎知識
Contents
- HTMLとは
- Hypertext Markup Languageの略。Hypertextとは,ハイパーリンクによって関連する複数のページがリンクされて一つの文書を成しているものを指す概念。Markup Languageとは,テキスト内にタグを埋め込むことで論理構造を作る言語。
HTMLとは本来、文書を「見出し」や「本文」などの構成要素に分類し、タグをつけてその構造を明確に示すものです。そして、その構成要素の性質を決定するのが属性です。
【例】
<P align="center">文章</P>
- タグ(tag)
- 上の例では「<P>」と「</P>」の部分を指します。
- 要素(element)
- 上の例では「<P align="center">文章</P>」の部分を指します。
- 内容(content)
- 上の例では「文章」の部分を指します。
- 属性(attribute)
- 上の例では「align="center"」の部分を指します。
SGML(Standard Generalized Markup Language)によって定義されたマークアップ言語をSGMLアプリケーションと言います。HTMLはSGMLアプリケーションです。SGMLアプリケーションは、DTD(Document Type Definition)により、要素や属性の名前、その親子関係や出現順序、出現回数などを定義されます。HTML4.01では、次の3種類のDTDが存在します。
- 完全DTD(Strict DTD)
- 廃止予定の要素や属性とフレーム関連を全て除いたDTDです。
http://www.w3.org/TR/html4/strict.dtd
- 過渡期用DTD(Transitional DTD)
- フレーム関連を除いて、廃止予定の要素や属性を含むDTDです。
http://www.w3.org/TR/html4/loose.dtd
- フレームDTD(Frameset DTD)
- フレーム関連と廃止予定の要素や属性を全て含むDTDです。
http://www.w3.org/TR/html4/frameset.dtds
使用するDTDを指定するには、文書の先頭でDOCTYPE宣言を行います。具体的には、以下のDOCTYPE宣言を文書の先頭に記述して示します。
- 完全DTD(Strict DTD)
- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01//EN" "http://www.w3.org/TR/html4/strict.dtd">
- 過渡期用DTD(Transitional DTD)
- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Transitional//EN" "http://www.w3.org/TR/html4/loose.dtd">
- フレームDTD(Frameset DTD)
- <!DOCTYPE HTML PUBLIC "-//W3C//DTD HTML 4.01 Frameset//EN" "http://www.w3.org/TR/html4/frameset.dtd">
BODY要素内に記述するほとんどの要素は、ブロックレベル要素とインライン要素に分類することが出来ます。
- ブロックレベル要素
- ADDRESS, BLOCKQUOTE, CENTER, DIR, DIV, DL, FIELDSET, FORM, H1~H6, HR, ISINDEX, MENU, NOFRAMES, NOSCRIPT, OL, P, PRE, TABLE, UL
- インライン要素
- A, ABBR, ACRONYM, APPLET, B, BASEFONT, BDO, BIG, BR, BUTTON, CITE, CODE, DFN, EM, FONT, I, IFRAME, IMG, INPUT, KBD, LABEL, MAP, OBJECT, Q, S, SAMP, SCRIPT, SELECT, SMALL, SPAN, TT, U, VAR
ブロックレベル要素は、他のブロックレベル要素やインライン要素を含むことが出来ます。BODY要素内に直接配置出来るのはブロックレベル要素で、インライン要素は必ずそのなかに含めて配置する必要があります。


- <
- 「<」を表示
- >
- 「>」を表示
- &
- 「&」を表示
- "
- 「"」を表示
詳しくは、24 Character entity references in HTML 4をご覧下さい。
HTMLでのコメントは以下のように記述します。
<!-- この部分がコメント -->
コメントの開始を示す部分の「<!」と「--」の間には、空白文字を入れずに必ず続けて記述します。但し、終了を示す部分の「--」と「>」の間には空白文字を含むことが出来ます。
言語コード
lang属性は、ISO-639標準である2文字言語コードに設定します。ISOの言語コードの後ろにダッシュ(-)を付けてサブコードを続ければ、地域を指定することもできます。例えば、"en"は英語を表すISOの言語コードですが、"en-US"はアメリカ英語を示す完全コードです。他の一般的な言語コードには"fr"(フランス語)、"de"(ドイツ語)、"it"(イタリア語)、"nl"(オランダ語)、"el"(ギリシャ語)、"es"(スペイン語)、"pt"(ポルトガル語)、"ar"(アラビア語)、"he"(ヘブライ語)、"ru"(ロシア語)、"zh"(中国語)、"ja"(日本語)、"hi"(ヒンズー語)などがあります。
【例】 <HTML lang="ja">
MIMEタイプ
「text/html」「image/png」「image/gif」「text/javascript」「text/css」などのMIMEタイプを指定します。このMIMEタイプには、正式には「メディアタイプ」(RFC2045)と呼ばれていますが、HTML4.01の仕様では出力媒体の種類を表す「メディアタイプ」と混同しないように「コンテント・タイプ」と表現されています。MIMEタイプの指定では大文字と小文字は区別されません。
文字コードセット
IANAに登録されている文字コードセットを指定します。JISの場合は「iso-2022-jp」、シフトJISの場合は「Shift_JIS」、EUCの場合は「EUC-JP」、US ASCIIの場合は「us-ascii」を指定します。文字コードセットの指定では大文字と小文字は区別されません。A・LINK要素のcharset属性でリンク先の文字コードセットを指定する場合などに使用されます。
【例】
<META http-equiv="Content-Type" content="text/html;charset=Shift_JIS">
<META http-equiv="Content-Style-Type" content="text/css">
ターゲット名
文書の表示先であるターゲット名には、アルファベットから始まる名前を指定します。そうでない場合には、ブラウザに無視されることになっています。但し、以下に示す4つのターゲット名は特別で、それぞれ次のような意味があります。
- _blank --- 新しいウィンドウに表示します。そのウィンドウは名前の無い状態になります。
- _self --- 元の文書と同じフレームに表示します。
- _parent --- 現在のフレームの親フレームに表示します。親フレームが無い場合には、「_self」と同様になります。
- _top --- 既にあるフレームを全て解除して、ウィンドウ一杯に表示します。親フレームが無い場合には、「_self」と同様になります。
パス
- パス
- コンピュータ内のファイルの所在地を表す住所のようなもの。例えば,エクスプローラー画像の右側の画面に表示されているAcrobat.pdfのパスは
C:\Acrobat3\Reader\Acrobat.pdf
となる。ここで,C:はドライブ名で,Acrobat3,Readerはフォルダ(コンピュータ内の区画)である。
- 絶対パス
- 絶対的な位置関係を示すパスのこと。例えば、エクスプローラー画像での
C:\Acrobat3\Reader\Acrobat.pdf
は絶対パスである。又、この絶対パスをUNIX風に直すと次のようになる。
/Acrobat3/Reader/Acrobat.pdf
UNIXではドライブという概念がない(を必要としない)為、絶対パスの先頭は常に/となる。
- 相対パス
- 相対的な位置関係を示すパスのこと。カレントディレクトリ(現時点のディレクトリ)に対して、..(上位階層), .(カレントディレクトリ), /(ディレクトリの区切り、又はルートディレクトリ)などで相対関係を示す。
例えば、エクスプローラー画像の例でカレントディレクトリがC:\Acrobat3\Readerだった場合、C:\Acrobat3\Reader内のファイルFillRdMeJ.txtを示す相対パスは、そのままFillRdMeJ.txtとなる。また、C:\Acrobat3\test.htmlを示す相対パスは、上位の階層のディレクトリを指す..を使い、../test.htmlとなる。下位階層内のファイル、例えばC:\Acrobat3\Reader\ActiveX\test.gifを示す相対パスは、ActiveX/test.gifとなる。いずれの場合にしても、.はカレントディレクトリを表す為、それぞれ./FillRdMeJ.txt, ./../test.html, ./ActiveX/test.gifでも同じ相対パスを表す。
拡張子
- 拡張子
- ファイル名の最後の文字から.までの文字を拡張子という。例えば、この文書のファイル名term.htmlの拡張子はhtmlであり、HTMLファイルと呼ぶ。拡張子により、ファイルの種類の区別が可能になる。インターネット上でよく使われる拡張子は、htmlとhtm(HTML)の他に、jpg(JPEG), gif)GIF), wav(WAVE), mid(MIDI), ra(Real Audio)pdf(PDF), zip(ZIP), lzh(LZH)などがある。
- 拡張子によるアプリケーションの関連付けは、マイコンピュータ→ツール→フォルダオプション→ファイルの種類で登録されている。
URL
- URL
- Uniform Resource Locatorの略。RFC1738で定義されている。例えば、http://www.komazawa-u.ac.jp/~w3c/lecture/html/term.htmlのように、プロトコル名(http://)、サーバー名(www.komazawa-u.ac.jp)=ホスト名(www)+ドメイン名(komazawa-u.ac.jp)、ディレクトリ名(w3c、lecture、html)、ファイル名(term.html)などの形で書かれる。
- また、index.html, index.htmはディレクトリを指定した場合に自動的に読み込まれる為、http://www.komazawa-u.ac.jp/~w3c/lecture/html/のようにURLを指定すると、http://www.komazawa-u.ac.jp/~w3c/lecture/html/index.htmlが表示される。
- DNS
- DNS(Domain Name System)により、ドメイン名はIPアドレスに変換される。
- DNSは、ホスト名(例えば"www.komazawa-u.ac.jp")の入力があるとDNSサーバ と呼ばれるコンピュータを参照し、そのホストのもつ IP アドレス(例えば"203.180.68.72")に接続するシステムである。例えるなら、DNSは氏名から電話番号を自動で調べる電話帳のようなものである。
HTMLに戻る