幕張の風

So-netブログ「From Makuhari~幕張の風」から移転しました。 仕事のこと、ニュースのこと、音楽のこと、野球はMarinesと高校野球中心に書きとどめたいことを書いて行こうと思います。

これがみかかクオリティ。

「フレッツサービス」および「ひかり電話」をご利用できない状況について(回復後)
http://www.ntt-east.co.jp/release/0705/070516a.html


原因は処理能力オーバー 「フレッツ」「ひかり電話」大規模障害
(It Media)
http://www.itmedia.co.jp/news/articles/0705/16/news039.html


お粗末極まりないですね。
昨日発生した、NTTフレッツ回線とひかり電話の大規模障害ですが、原因はソフトウエアのトラブルとのことです。

リンク先の記事を読んでも、なんとなく「NTTの対応が悪いのは分かるけど、でも、いったい何が問題だったの?」っていう方が、ほとんどだと思います。
このトラブルについて、簡単にご説明してみましょう。


コンピュータのネットワーク(いわゆるインターネット)は、不規則にケーブルがつながったものの集合体です。ですから、自宅からパソコンでインターネットにアクセスする為に、単にパソコンにケーブルをつないだだけでは、いったいどこのデータを呼び出すのか、どの相手にデータを送るのか、まったく整理が出来ずデータのやり取りなどは出来ません。

ですから、ネットワークの中をデータが通る時、パソコンはデータを「パケット」というひとかたまりの箱に入れて、行き先(ルート情報:IPアドレスなどを言います)を記した上で、データをネットワークに送り出しています。

ネットワークに乗せられたデータは、行き先(ルート情報)に従って、送ったパソコンの中継地点(通常は自宅に設置されている光ファイバー回線接続用のルーターやADSLモデムがこの機能を持っています)へ届きます。中継地点になるルーターは、このパケットのルート情報を見て、行き先のルートを探し出し、相手(受信先のルーター)を見つけてから、ルーターの更に外側のネットワークへ、改めてデータを送り出すのです。

昨日の障害は、NTTの交換機内に設置されたルーターの一台が壊れて交換を行ったのですが、そうするとこの交換されたルーターの情報(IPアドレス)が変わりますので、ネットワーク内に存在する他のルーター全部に書かれていた、このルーターの存在を示す情報を書き換える必要が出て来ます。

例えるなら、市町村合併で住所が変わって、郵便番号が変わったようなものです。ただ郵便は、運ぶのが人間ですから古い郵便番号でも届きますが、機械はそうは行きませんから、たった1台変更しただけですべてのルーターのデータを書き換えなければならないのです。

ネットワークの設計をする時には、こういったハード障害も想定して、ネットワーク内のルーターのアドレス情報書き換えのプログラムも併せて設計するものですが、どうもこの書き換え用のプログラムがお粗末なものだったようですね。

書き換えの時に、ネットワーク上のルータすべてにデータを飛ばすわけですから、いきなり全部のルーターへ送り出していては回線が圧迫されてデータ通信が出来なくなりますし、何よりも元々のルーターの能力(1秒間にいくつのパケットを処理出来るか)を超えてしまう危険があります。
そこで、書き換えの時には普通はこの更新のパケットが一気に出ないように制御をして、順番に更新をかけていくようにプログラムを作るものです。
但し、このニュースを読む限りは、こういった配慮のされていない更新プログラムで、一気に更新用のパケットが流れてしまい、ルーターが次々に処理能力をオーバーしてハングアップ(いわゆる“固まった”状態です)してしまったようですね

プログラムの検証不足という、ネットワークのインフラを担う企業にしては、正直なところあまりにも“お粗末”としか言えないトラブルです。それでもNTT的には、「東京23区内」で発生しなくて良かった、と言ったところなのでしょうね。

NTTはつい先日も、IP電話の障害が発生したばかりです。新しい通信インフラのシェア獲得競争の中で、KDDIソフトバンクと、コスト面も含めた厳しい争いの最中で、こういった初歩的トラブルを頻発させてしまうところが、いかにも「みかか」クオリティですね。

えっ、なんで“みかか”かですって?お使いのパソコンのキーボードのかな表示を「み」「か」「か」と順に追ってください。かなの横にアルファベットがあると思いますが、それを順に並べると・・・お分かりになりましたか?