トラブルへの対応には多くの困難が伴います。プロダクション機の情報が取得できず原因追及に着手できない,
トラブルと真正面から向き合う+調べる
障害発生時にすべきこととは
ソフトウェア開発においてバグや作業ミスによるトラブルはつきものです。トラブルに遭遇したときは焦ってしまいがちですが,
[事例1]納品先で固まるプログラム
新人のころ,
会社の開発マシンでは問題なく動いていたので非常に焦りました。お客様にお詫びして検収を延ばしてもらい,
お客様と同一機種のマシンがなかったので,
開発環境と実行環境の差でプログラムが動作しないというのはよくあります。サーバサイドのプログラムでは,
- 注1)
- バッファリングという処理です。
[事例2]起動しないWeb App Server
筆者がかかわっていた業務アプリ開発現場での話です。Webアプリケーションサーバが起動途中にクラッシュしてしまうという現象が何日も解決できず,
- 注2)
- 同時接続数やトランザクション量などから推奨されるサーバの設定値を記した表。
[事例3]終わらない移行作業で負け試合
とあるバッチ処理を新方式に移行する作業をしていました。メインフレームから送られてきた固定長の販売データをRDBに格納します。新規開発したバッチプログラムを新規プロダクション機にデプロイし,
なぜ,
処理方式だけでなく,
旧システムと新システムの出力の差異はよくトラブルになります。旧システムの実装を確認せずに進めると,
[事例4]突如,激遅になったOLAP
業務システムに負荷をかけず,
翌日から,
製品選定,