関係演算子

計算機科学において、関係演算子(かんけいえんざんし、: relational operator)または比較演算子(ひかくえんざんし、: comparison operator)とは、プログラミング言語演算子で、2つの対象の関係を調べるものをいう。たとえば、同値関係を調べる等号)や、順序関係を調べる不等号)などが含まれる。

JavaC#など、独立したブーリアン型型システムに持つ言語では、関係演算子は2つのオペランドの間に演算子が表す関係が成り立つかどうかによって真 (true) または偽 (false) を返す。一方で、C言語などのブーリアン型を持たない初期の言語では、関係演算子は整数 0(偽を意味する)または 1(真を意味する)を返す。

関係演算子を含むは、関係式 (relational expression) または条件 (condition) と呼ばれる。また、技術的な文献において、関係を言葉で説明する代わりに関係演算子が用いられることもある。多くのプログラミング言語では、関係演算子は中置記法で記述される。たとえば、以下のC言語のコードは、xy より小さい場合にメッセージを表示するものである。

if (x < y) {
    printf("x is less than y in this example\n");
}

他方で前置記法を採用している言語もある。たとえば、Lispでは以下のように書く。しかしこれは演算子というよりも、Lispでは識別子に使える文字の範囲が緩くて、単に >= という名前の関数であるというだけである。

(if (>= x y)
    (display "x is greater than or equal to y in this example"))

標準的な関係演算子

多くのプログラミング言語で使用されている標準的な数値比較演算子を以下に示す。

一般的な数値比較演算子
様式 等しい 等しくない より大きい より小さい 以上 以下
数学
Fortran[note 1] .EQ. .NE. .GT. .LT. .GE. .LE.
ALGOL 68[note 2] = > <
/= >= <=
eq ne gt lt ge le
BASICライク[note 3] = <> > < >= <=
MUMPS = '= > < '< '>
Pascalライク[note 4] = <> > < >= <=
C言語ライク[note 5] == != > < >= <=
sh後継のシェル[note 6] == != > < >= <=
-eq -ne -gt -lt -ge -le
バッチファイル EQU NEQ GTR LSS GEQ LEQ
MATLAB[note 7] == ~= > < >= <=
eq(x,y) ne(x,y) gt(x,y) lt(x,y) ge(x,y) le(x,y)
Mathematica[1] == != > < >= <=
Equal[x,y] Unequal[x,y] Greater[x,y] Less[x,y] GreaterEqual[x,y] LessEqual[x,y]
  1. ^ Fortran 90からはC言語ライクな比較演算子もサポートされている。
  2. ^ ALGOL 68: "stropping" regimes are used in code on platforms with limited character sets (e.g. use >= or GE instead of ), platforms with no bold emphasis (use 'ge'), or platforms with only UPPERCASE (use .GE or 'GE').
  3. ^ Visual BasicVB.NETOCamlSQLStandard MLなど。
  4. ^ SimulaModula-2Object PascalDelphiAdaOberonOCamlStandard MLなど。
  5. ^ C、C++C#GoJavaJavaScriptPerl(文字列比較演算子は別に用意されている)、PHPPythonRubyRなど。
  6. ^ bashkshzshなど。上段のC言語ライクの演算子はシェルでは算術式評価の文脈でのみ数値比較の意味を持つ。それ以外の文脈では上段は文字列比較演算子である(文脈によっては<等にクォートが必要)ため、その文脈で数値比較を行うには下段の演算子を使う。
  7. ^ MATLABはC言語ライクな比較演算子を提供するが、!= を用いない。MATLABにおいて、! はシェルコマンドの記述に用いられるからである。上段の形式はSmalltalkでも用いられるが、等号は = となる。

等号

代入演算子との混乱

C言語から直接または間接的に派生したプログラミング言語では、同値関係の関係演算子として、直感的な = ではなく == を用いる。一方、= を用いる言語としては Pascal、BASIC、Ada、Standard ML、Objective Caml、SQL、VHDL などがある。

C言語は広範囲に普及したため、後発のプログラミング言語における構文や仕様はC言語のそれを参考に定義されたものも多いが、そのうちの一つがこの == 演算子である。この独特の構文は、B言語開発の初期の段階で = を別の意味に割り当てたことに端を発する。ALGOLとFORTRANの流れを汲むB言語の設計者は、タイピングを減らしたいという要望から、頻繁に記述される更新・代入操作のためのコピー演算子として = を代用することを決定した(これは A = A + 1 のような、一見して「数学的には不成立」な式が許容されることを意味する)。代わりに、= が本来担う役割である等号として == が使われることとなった。C言語はこれらの演算子をそのまま引き継ぎ、以後JavaやC#をはじめとする多くの言語がこの構文を採用したのである。

これらのC言語ファミリーにおける = の用法はバグの温床になりうる。C言語にはブーリアン型がなく、if文while文の条件式には真偽値に評価されうる任意の数値型の式を受け付ける(ゼロあるいはゼロ相当を偽、非ゼロを真とする)。またC言語における代入はではなくであり値を持つ。そのため、プログラマーが if (x == y) の代わりに、if (x = y) とミスタイプしても構文的には合法となってしまうのである。C言語において、if (x == y) は大雑把に言えば「xy が等しければ後続の文を実行せよ」を意味する。しかし、if (x = y) とミスタイプすると「xy の値を割り当て、もし x の新しい値が0でなければ、後続の文を実行せよ」という意味になってしまう。たとえば、下記の例で if (x = y) と書いてしまうと、yx に代入され両方とも2になり、更に x の値2は0ではないので、常に if 文のブロックが実行される。したがって、以下のコードは "x is 2 and y is 2" を出力する[2]

int x = 1;
int y = 2;
if (x = y) {
    /* yが0でなければ以下のコードは常に実行される */
    printf("x is %d and y is %d\n", x, y);
}

他の言語やコンパイラの中には、このようなミスを事前に防ぐように工夫されているものもある。

  • 同じ演算子を持つJavaやC#も同様の問題を孕んでいるが、これらの言語ではこの種の誤りは、ほとんどの場合コンパイルエラーとして検出できる。if文while文などの条件式はブーリアン型に制約され、また他の型(例えば整数型)からブーリアン型に暗黙的に変換されることもほとんどないからである[注釈 1]
  • GCC/ClangMicrosoft Visual C++などのいくつかのコンパイラでは、if や while の条件式中に代入演算子を含んでいるコードをコンパイルするときに警告を出す(-Wparentheses、C4706[3])。
  • PascalやAdaなどでは、Cと違い代入演算子は:=、等値比較演算子は=であり[4]、また式の途中に代入演算子は登場できないので、この種の誤りは排除できる。
  • Pythonにおいては、C同様に代入演算子は=、等値比較演算子は==であるものの、代入は式ではなく文であり[5]、この種の誤りは排除できる。Python 3.8では値を返す代入式が導入されたが、Pascalと類似の代入演算子:=が使われるため、通常は比較演算子の==と混同するようなことはない[6]
  • BASICなどのいくつかの言語では、文脈に応じて構文的に弁別できることから、代入演算子[7]と等値比較演算子[8]の両方に = 記号を使用する。BASIC系では代入は式ではなく文であり[9]、代入演算子としての=のほうは式中に出現することがない。

また、プログラマーの中には予防策として、定数に対する比較を記述するとき、以下のように直感とは逆の順でオペランドを記述する者もいる。定数は左辺値ではないので、このように比較演算子の左側に記述するスタイルにしておけば、たとえ誤って = と書いてしまったとしても、そのコードは不適格となる。コンパイラは不適格コードに対してエラーメッセージを出力し、コンパイルを中断するので、記述ミスに気づくことができ、結果、適切な演算子に修正できるのである。このコーディングスタイルはヨーダ記法や left-hand comparison として知られている。ただしこの記法には、比較対象の少なくとも片方が左辺値を持たないような場合にしか使えない、多くの場合は重要な側(自然言語で考えたときに主語となる側)の式が後から現れることになる、といった欠点がある。コーディング規約として推奨しているプロジェクトもあれば、推奨していないプロジェクトもある。

if (2 == a) { /* 仮に = と == を誤用した場合はコンパイルエラーを引き起こす */
    /* ... */
}

なお、C/C++では、以下のように意図的に条件式中に代入式が書かれることもある。ただし前述のように、コンパイラは通例このようなコードに対しても警告を出す。

FILE* fp = NULL;
if (fp = fopen("sample.txt", "r")) {
    /* 指定したファイルを開くことができ、fp が non-null となった場合の処理 */
    fclose(fp);
    fp = NULL;
}

PHP での拡張

PHPでは、== 演算子をさらに拡張し、型が異なっても値が等しければ真を返す == 演算子(たとえば 4 == "4" は真である)と、値が等しくかつ同じ型を持っている場合に真を返す === 演算子(たとえば 4 === 4 は真であるが 4 === "4" は偽である)の2種類の演算子を持っている[10]x == 0x0"0"(文字 0 を含む文字列)または false(PHPでは他の言語でも見られるように、false0 と等しい)のときに真を返す。これは、変数に 0 の値が割り当てられているかを確認するのに便利であるが、必ずしも期待される動作とは限らない[10]。一方で、x === 0x0 のときのみ真を返す。

オブジェクトの同一性と内容の等価性

多くの現代的なプログラミング言語において、オブジェクトやデータ構造は参照を通じてアクセスされる。そのような言語では、2種類の異なる等価性を判定する必要性が生じる:

  • 物理的な等価 - 2つの参照が同じオブジェクトを参照しているかどうか
  • 構造的な等価 - 2つの参照が参照するオブジェクトがある意味において(たとえば内容が同じであるなど)等しいかどうか
    • 浅い等価判定(対象オブジェクトの持つ各メンバについて等価性を判定する)
    • 深い等価判定(対象オブジェクトの持つ各メンバに加えて、対象オブジェクトから参照できる全てのオブジェクト各メンバについても等価性を判定する)

通常、前者の等価性は後者の等価性を含意しているが(自身に等しくないような NaN のようなものは除く)、逆は必ずしも真ではない。たとえば、2つの文字列オブジェクトは別個のオブジェクトであるかもしれない(前者の意味では等しくない)が、同じ文字の並びを持ちうる(後者の意味で等しい)。

次の表では、これらの2種類の等価性を判定するための異なる方法を、様々な言語において一覧できるようにしてある。

言語 物理的な等価 構造的な等価 備考
C, C++ a == b *a == *b abはポインタである
C# object.ReferenceEquals(a, b)1 a.Equals(b)1
Common Lisp (eq a b) (equal a b)
Java a == b a.equals(b) abは参照である
OCaml a == b a = b
Pascal a^ = b^ a = b
Perl $a == $b $$a == $$b $a$bはスカラーリファレンスである
PHP5 N/A $a == $b $a$bはオブジェクトである
Python a is b a == b
Ruby a.equal?(b) a == b
Scheme (eq? a b) (equal? a b)
VB.NET a Is b a = b
Objective-C a == b [a isEqual:b] abはオブジェクトへのポインタである
1 C# では、参照型に対する == 演算子は既定で ReferenceEquals() メソッドの呼び出しと等価になるが、代わりに Equals() メソッドを実行するように演算子オーバーロードをすることができる。このことによって、構造的な等価性の方がより直感的と思われる型において、== で構造的な等価性を判定するようにできる。特に文字列比較において、このことが効果的である(Java で文字列比較は a.equals(b) と書かなければならないが、C# では a == b と書ける)。ただし、変更可能 (mutable) な参照型の場合は、==演算子をオーバーロードすべきではないとされている[11]。多くの.NET言語では、参照型における組み込みの比較演算子は参照の等価性を判定するために用意されているものであり、驚き最小の原則の観点からも、一般的にオーバーロードは避けるべきとされている[12]

論理的同値性

一見して自明ではないが、比較演算子は、互いにほかの比較演算子を用いて論理的に同値な命題を構成できる。これは、ちょうどブール論理論理演算子 XOR、AND、OR、NOT の間で見られる関係に似ている。以下の4つの条件式は互いに論理的同値である。

さらに、等号も不等号を用いて表現することができる。

この性質をプログラミングに応用して、不等号 ≥ だけ(または、≥ と = の二つだけ)を真面目に実装し、ほかの比較演算子を ≥(または、≥ と =)を用いて定義することも行われる。

脚注

注釈

  1. ^ ただしJavaのjava.lang.Booleanbooleanに暗黙変換される。また、C#ではboolへの暗黙変換演算子や、true/false演算子をユーザー定義することもできる。このようなケースでは、JavaやC#であっても条件式を書くべきところに間違って代入式を書けてしまう。

出典

関連項目