Tales of Mados & Ringos / 真・窓と林檎の物語
トップ窓と林檎 → その情けに… 1997.09.29

--------------------------
真・窓と林檎の物語
--------------------------

その情けに報いるべきか、否か?

  さてさて、今宵は少し(かなり?)高尚な気分になって理論的な話をすることにする。 その割にはくだけた例えも出てくるかも知れんが、そこはそれ、 適当に納得してもらいたいもんである。 そもそもタイトルを見て、その内容を想像できた読者の方はいたであろうか? 情けに報いるとは、これ如何に? そう、「情報」とは何かという話である。 が、はっきり言って、 「情報」はあまりに多くの側面を持つので一言で簡単に表現することは出来ない。 仕方がないので情報そのものについて語る代わりに、 「情報理論」の初歩について書くことにする。

  情報理論と言っても、実は情報を運ぶモノに関する理論である。 Shannonという賢い人が考え出したこの理論は、 皆の衆もよく使っているbitという単位の根本的な意味を与えるものである。 「bitなんて簡単、01の数だろうが!」とぬかす輩もおろうが、そうではない。 bitは本来は情報の量を計っているのであり、01の数はデータの量を計っているのだ。

  情報関係の講義を受けた読者諸君はおわかりかと思うが、 情報理論を真面目に語るにはエントロピーやら通信シンボルやら無記憶情報源やら通信路容量やら瞬時に復号可能な符号やらハミング距離やらファーノの限界やら、本来なら実にいろいろな専門用語が必要なんである。 が、そんなもんを何も知らない人に図も数式も使わずに説明するのはほとんど人間国宝的文才を必要とするので、 今のところ人間国宝ではない我輩はとっととbitの意味だけを念入りに説明することに決めた。 これを読んで興味がわいた読者の人は各自で本を探して読んでくれたまへ。

  で、いつもながら適当な比喩を考えたんであるが、 なかなか浮かばないのでなかなかに困ったが、苦労の末思いついたありがちな例で済ましておく。

  野球の大好きなオヤジがいたとする。しかしオヤジの会社はこの不況の中、 珍しく仕事がたくさんあって毎日遅くまで残業だという。 オヤジとしては早く帰ってテレビでプロ野球中継を見たいのだが、 毎日残業続きでストレスが溜っている。 会社の中でこっそりラジオやテレビをつける事も考えたが、 自分だけでなく周りにもたくさん人が残業してるのであきらめた。 が、自分の机は窓際にあるので、どうにかそれを利用しようと考えた。 オヤジの会社の入っているビルのまん前はマンションで、 うまい具合にそこにオヤジの大学時代の後輩が住んでいるのであった。 そこでそのオヤジ、 「テレビで野球中継見て、窓から結果を教えてくれよ!」と後輩にお願いした。 もう優勝チームが決まって個人タイトルに関心が移っていたので、 オヤジはごひいきの選手の一打席一打席を前のマンションの窓からちゃっかり教えてもらえることになった。

  が、ここでオヤジははたと考えた。どうやって教えてもらおうか?でっかい紙に書いてもらうか? いや、だめだ。会社のビルとマンションはそんなに近くないし、だいいち紙がもったいない。 それにもし上司がマンションのでかい紙に気がついたらただでは済まないではないか。 う〜む、困った。ところが、どういうわけか、マンションの後輩の部屋には、 子供が運動会で使った赤白の手旗があるんである(笑い出してはいかん)。 さらには、オヤジのゴヒイキの選手は全ての打席が三振、 キャッチャーフライ、ピッチャーフライかホームランのどれかという、 当たっても絶対横の方には飛んで行かない、それはそれはまっすぐ律義なバッターであった。 そのため、その4種類を手旗の信号を使って

  • 三振が白-白
  • キャッチャーフライが白-赤
  • ピッチャーフライが赤-白
  • ホームランが赤-赤
となるように決めて、試合の度に後輩に送ってもらうようになった。

  オヤジはすっかり喜んで残業にも身が入るようになったが、 面白くないのは信号を送らされるマンションの後輩の方だ。

「なんで俺がこんなことをする必要があるのか! 飯食って風呂入ってはよ寝たいわい!」
と心の中で叫んだものの、 小心者なのでオヤジには言い出せなかった。 そこで、ない知恵絞っていろいろ考え、どうにか手を抜こうとした。 で、何試合かその選手の打席に注目しているとあることに気がついたんである。
「おまえ、キャッチャーフライばっかりやんけー!」
そうなのである。オヤジのゴヒイキの選手は最近極度のスランプなのであった。 試しに数えてみると、最近10打席でなんとキャッチャーフライが7回もあった。 「これは!」ということで
  • キャッチャーフライが白
  • 三振が赤-白
  • ピッチャーフライが赤-赤-白
  • ホームランが赤-赤-赤
となるように信号を変えてもらった。 するとどうだろう! たいていの場合はキャッチャーフライで、旗を一回振るだけでいいのですごく得した気分である。 10打席分をまとめて考えると、 キャッチャーフライが7回、三振が1回、ピッチャーフライが1回、ホームランが1回 あったので、合計は7"+2"+3+3で15回で済んだのであった。 つまり、一打席あたり1.5回の旗振りである。 これは以前のようにいつも2回旗を振っていたのに比べて、かなり減っている。 どうしてそんなことが可能なのであろうか? 結論から言うと、そもそも「送っていた情報量が最初から2回分に足りなかった」んである。 データとしては旗振り2回分あったが、 肝心の中身の情報量はそれより少なかったのだ。 対数とかいう小難しい関数を使うと、 この信号は平均で0.76という情報の量を持っていることがわかる。 このような感じで、出てくる確率にもとづいて情報を計るやり方が「情報量」であり、 その単位がbitなんである。

  ここで大事なのは、出てくる確率が変わると情報量も変わるという点である。 例えば、かのバッターがスランプを脱出して、鬼のように打つようになったとする。 内野安打、センター前ヒット、ライト線2塁打、ホームランのどれかをずっと打ちまくっている。 この時、以前の信号の旗振り回数を使って

  • 内野安打が白
  • センター前ヒットが赤-白
  • ライト線2塁打が赤-赤-白
  • ホームランが赤-赤-赤
のような信号を使うとすると10打席で内野安打が2回、センター前ヒットが3回、ライト線2塁打が3回、ホームランが2回 あった時に、合計で2+6+9+6で23回も旗を振ってしまうことになる。 以前は15回で済んだのにどうしたことか? これなら、全部2回振る以前の信号で合計20回の方がまだマシではないか。 どうして、こうなるのか。それは信号の中身の出てくる確率が変わったからである。 ちなみに、出てくる確率が全て等しい時に一番情報量が大きくなることになっている。 そして特に、出てくる信号が2種類でどちらも同じ確率の時に、 それは1bitの情報を持っている事になる。 例えば、誰かとジャンケンをして勝てる確率はほとんど半々なので、 その勝ち負けの情報量は約1bitであると言える。 なんとなくわかったであろうか? ついでに言えば、必ず凡退するへぼバッターは情報量ゼロである。 なぜなら、信号を送っても送らなくても、「打たない」ことはわかり切っているからである。 というわけで、信号を送ったとしてもその情報量はゼロなのだ。

  ここから、一気に身近な話になる。 皆の衆も良く使うであろうファイル圧縮ソフトであるが、 上の事が基本原理である。 対象となるファイルの中で、 何がよく出てくるかをチェックしてその部分を短くなるように信号を作り直して保存しているのだ。 なので、究極の圧縮ソフトはそのファイルの持つ情報量ギリギリまで圧縮できることになる(情報量より少なくはできない、できたらインチキだ)。 これでなんとなくピンとくるようになったであろうか?

  ま、以上のようにして情報を計る単位は定められているのであるが、 量だけわかればそれで良いかというと、そうではない。 一筋縄ではいかないのだ。なぜか? 人によって同じ情報量の情報を得てもその価値は大きく異なること、 これが情報を一言で説明できない理由である。 確かにプロ野球の結果速報はファンの人にはとても重要な情報であるが、 球打ち名人たちの運動の結果などどうでもいいという人種にとっては何のありがたみもない。 他にも例えば、世紀の一大叙事詩がロシア語で記された紙があっても、 ロシア語を読めない人にとってはそれは紙の上の汚れと大差ない。

  こう考えると、 あなたの1Gハードディスクに入っている情報量はいったい何ビットなのか、 大変興味のあるところである。しかも、その情報があなたに対して持つ価値と、 他の人に対して持つ価値は残念ながら(幸運なことに?)同じではないのだ。 というわけで、今回はずいぶんと難しい話に手を出したのであった。

  果して、天が与え給うた、その情けに報いることは可能なのだろうか?

written by

窓と林檎 | 日々是考難(blog) | トップ