Just Do It
BCM, 조직을 살아있게 만드는 기술 본문

“회사의 업무가 잘 돌아가고 있는 이유는
보이지 않는 곳에서 누군가가 ‘계획된 대혼란’을 미리 대비해 놓았기 때문이다.”
회사에서 장애가 발생하는 일은 생각보다 흔하다. 물론 외부에 알려지는 일은 거의 없다.
그렇다고 문제가 없는 건 아니다.
단 몇 분의 장애로도 고객 불만이 폭주하고, 시스템이 마비되며, 담당자들은 밤을 새운다.
이 경험을 하면서, 나는 깨달았다.
진짜 위기는 ‘사고 그 자체’보다도, 그것에 준비되지 않은 상태에서 맞이하는 것이다.
작년에 우리 회사는 Business Continuity Management, 줄여서 BCM 체계를 처음 수립하고 운영했다.
그 프로젝트에 내가 실무 담당자로 투입되었고, 예상대로? 아니 예상보다 훨씬 더 복잡하고 지난한 여정이 펼쳐졌다.
하지만, 그 과정을 통해 나는 모르는 걸 또하나 더 배우게 되었다. 그만큼 성장했고 말할 수 있다.
BCM이란 무엇이고, 왜 기업에 꼭 필요한지. 그리고 그것이 단순한 매뉴얼 그 이상의 전략이라는 것을.

BCM이란 무엇인가? 책 정의보다 더 현실적인 해석이 필요하다
교과서적으로 BCM은 이렇게 정의된다.
“기업이 위기상황에서도 핵심업무와 기능을 계획된 수준으로 지속할 수 있도록
전사적인 정책 및 절차를 수립하여 이행하는 총제적인 관리 시스템.”
하지만 이건 너무 딱딱하다.
내가 체감한 BCM은 이렇다.
‘조직 전체의 숨은 혈관을 하나하나 정리하고, 피가 막히지 않도록 하는 준비행위’였다.
서버 하나 멈춰도, 그 서버가 어떤 업무를 담당하고 있는지,
누가 그것에 의존하고 있고, 복구 시간은 어느 정도가 되어야 하는지 등
수많은 의사결정이 뒤따른다.
이때 필요한 것이 바로 업무영향분석(BIA)이고, 복구 목표시간(RTO), 복구 시점 목표(RPO) 같은 지표들이다.
실제로 경험한 BCM 구축, 가장 힘들었던 건 ‘사람’이었다
BCM은 기술이나 서류가 아니다. 결국 ‘사람의 이해’와 ‘조직의 합의’가 가장 중요한 부분이다.
당시 나는 각 부서 실무자들을 수십 명 만나며, 업무를 하나하나 쪼개어 묻고 정리했다.
그 과정에서 놀라운 사실을 발견했다.
본인의 핵심업무가 무엇인지 정확히 설명 못하는 경우가 의외로 많았다.
한 분은 말끝마다 "이건 그냥 매일 하는 거예요"라고 말씀하셨는데,
그게 시스템 장애 시에는 가장 먼저 복구돼야 할 중요한 절차였다는 것을 확인하고 본인도 깜짝 놀라셨다.
우리는 함께 그 업무의 복구 우선순위를 조정했고, 단순 매뉴얼이 아니라 ‘현실적인 복구 시나리오’를 짜게 되었다.
뉴스와 외부 정보도 중요하다. 인터넷에는 이렇게 정리되어 있다.
최근 검색해 보니 금융권, 통신사 중심으로 BCM의 중요성을 재조명하는 흐름이 있었다.
특히 지난해 몇몇 대기업에서 장애로 인해 전산망이 중단되었던 사건 이후,
‘BCM 부재’ 혹은 ‘무늬만 매뉴얼’ 문제를 지적하는 기사들이 보였다.
인터넷에서는 BCM을 ‘DR(재해복구)’와 혼동하거나,
단순히 문서 작업 정도로만 이해하는 경우가 많았지만,
실제로는 모의훈련, 시나리오 테스트, 전사적 의사결정 시뮬레이션 등
지속적인 실전 대비가 필수라는 점이 강조되고 있었다.
복잡한 구성은 어떻게 이뤄지는가?
프로젝트를 하며 경험한 BCM의 구성 단계는 대략 이렇다.
- 분석 및 계획: 업무영향분석(BIA), 위험평가, RPO/RTO 산정 등
- 설계 및 개발: 복구 전략 수립, DR 인프라 검토, 프로세스별 복구절차, 조직 훈련
- 유지보수: 점검, 내부감사, DR 테스트, 개선 활동
그리고 마지막으로 반드시 확인해야 할 것은,
이 체계가 '유효성, 적절성, 품질'을 갖추고 실제로 작동하는가이다.
결론을 앞에 두고 말하자면
BCM은 회사를 지키는 ‘무대 뒤 주연’이다.
조직이 장애를 겪을 때, 겉보기에는 평온해 보일 수 있다.
그러나 그 이면에서는 누군가가 미리 짜놓은 BCM 체계가,
하나하나 조용히 작동하고 있는 것이다.
그 작업에 내가 참여했다는 건,
실무자로서 정말 값진 경험이었고,
앞으로 어떤 위기 상황에서도 흔들리지 않을 조직을 위해
꼭 필요한 일이라고 느꼈다.
혹시 이 글을 읽는 분들 중,
조직의 안정성, 연속성, 위기 대응력을 고민하고 있다면
BCM이라는 프레임을 꼭 한번 검토해보시길 바란다.
실제 적용은 쉽지 않지만, 그 효과는 사고가 ‘벌어지지 않도록’ 막아주는 든든한 백 그란운드 되어줄 것이다.
'IT 기술을 배워보자' 카테고리의 다른 글
| MECE와 LISS, 전략적 분석방법을 소개합니다. (0) | 2026.01.22 |
|---|---|
| CVE와 CWE, 보안의 기초이자 본질 (0) | 2026.01.21 |
| 프로세스 마이닝, 자동화 시대의 길잡이 (1) | 2026.01.21 |
| SLA와 SLM으로 알아본 IT 실무 (1) | 2026.01.20 |
| 실무자의 시선으로 알아본 'IT 아웃소싱(IT Outsourcing)' (0) | 2026.01.20 |
