ひとつのバグを1年間追い続けた男たちの話

1960年代前半のこと,ベル研究所が米国政府のミサイル防衛計画に参加していたことがある。そこで開発されたミサイル追跡システムは,実地試験の際,計65発の試射のうち6発だけを取りこぼしたという。

ここで問題になったのは,その6発のうち1発はプロセッサーのエラーによって発生した失敗だったということ。単なる誤差ではなくハードウェアの信頼性に問題があるとしたら大変だ。そこで研究所では,この原因の調査に2人の従業員が割り当てられることになった。

この2人の調査チームは試験データを基にひたすら原因を調べ続けた。しかし,調査開始から1年経っても原因を特定することはできなかった。ついにはチームの拡充が図られることになった。その結果,ようやくレースコンディションらしきものを,回路の一部に見つけることができた。

そののち,同様の不具合が他にも無いかどうか確かめるために総ざらいの調査が行われた。結果として計12箇所の修正が行われたという。

Computing History at Bell Labs - research!rsc

はい,これが,ひとつのバグを1年間追い続けた男たちの話。ソフトウェアに求められる信頼性の程度は様々だけれど,ミサイル追跡システムにもなると,2人の技術者を1年間それに貼り付けるぐらいのことはする,というひとつの事例。もっともこれは,テスト(ミサイルの試射)を実施するのに費用がかかり過ぎるから,それよりかは技術者を貼り付けておいた方が安くつく,という経済的な事情もあったのだろうけどもね。