Just Do It

SLA와 SLM으로 알아본 IT 실무 본문

IT 기술을 배워보자

SLA와 SLM으로 알아본 IT 실무

everything0325 2026. 1. 20. 23:03
반응형

지난번 글에서 IT 아웃소싱에 대해 이야기 해 드렸고, 이제는 그 용어가 익숙해졌다고 생각 되지만,

그 안을 들여다보면 생각보다 조금 더 복잡한 구조와 또다른 IT 용어가 숨어 있다.

단순히 외주를 준다고 끝나는 게 아니라, '무엇을, 어떻게, 어느 수준으로 맡길 것인가'가 중요하다. 조금 헷갈릴 수도 있는데, 

그 기준이 바로 SLA(Service Level Agreement), 그리고 그것을 지속적으로 평가하고 개선하는 SLM(Service Level Management)이다. 이번 글을 통해서 내가 직접 겪은 아웃소싱 사례를 바탕으로, SLA와 SLM이 왜 중요한지 왜 알아야 하는지 이야기해 보려 한다.

문제는 ‘맡겼다’가 아니라, ‘어떻게 맡겼느냐’였다

지금도 기억에 남는다. 몇 달 전, 우리 회사의 한 핵심 서비스가 갑자기 정지됐다.

아무도 예상하지 못했던 순간이었다. 당황스러운 마음으로 로그를 뒤지고 장애 원인을 파악하던 중, 의외의 사실이 드러났다.

외부 OO사에 위탁한 서버 헬스체크 업무에서, 1주일 넘게 메모리 사용량이 100%에 근접하는 이상 현상이 감지되었음에도 불구하고 보고가 누락된 것이었다. 보고서에는 매주 "이상 없음"이라고만 써 있었고, 우리는 그걸 믿고 있었던 것이다.

이때 내가 가장 먼저 꺼낸 문서는 SLA 계약서였다.

해당 서비스에 대해 우리가 어떤 수준의 서비스를 요구했고, 그들이 어떤 의무를 지기로 했는지 하나하나 확인했다.

그리고 그 기준에 따라 SLA 미이행에 대한 책임을 명확히 요구했고, 결국 업체 측 영업이사와 협의를 통해 보상과 재발 방지 계획을 받아낼 수 있었다. 정말~ 아찔했던 기억이었다. 휴~~

SLA, 단순한 계약이 아닌 ‘기준점’

SLA는 말 그대로 서비스 수준 협약서다. ‘이 서비스를 어떤 수준으로 제공해야 한다’는 것을 정량적으로 명시한 문서다. 단순히 ‘잘 해주세요’가 아니라, ‘월 가동률 99.9% 이상’, ‘SR 처리 지연율 1% 이하’ 등 측정 가능한 지표로 관리된다.

실무에서 SLA를 작성하다 보면 꼭 포함되는 항목들이 있다. 대표적으로는 다음과 같다.

  • 기본 계약서: 계약 전반을 포괄
  • SoW(Statement of Work): 상세한 업무 기술서
  • 서비스 카탈로그: 어떤 서비스를 어떤 범위로 제공할 것인지
  • 서비스 수준 Metrics: 장애율, 가동률 등 정량 지표
  • 서비스 목표치(Objectives): 기준선과 목표 수치
  • 측정 기준: 어떻게, 어떤 주기로 측정할 것인가
  • 보고 방식: 어떤 형식으로 보고하며, 누가 보고를 받을 것인가

나는 이중에서도 특히 SoW와 서비스 수준 Metrics를 꼼꼼하게 본다.

SLA를 체결할 때 이 두 항목이 모호하게 작성되면, 나중에 문제가 생겼을 때 책임 소재를 따지기 어렵기 때문이다.

SLA와 SLM의 연관표

SLM, 계약 이후의 ‘진짜 운영’

SLA가 계약이라면, SLM은 그 계약을 지속적으로 운영하고 개선해가는 체계다. SLM(Service Level Management)은 단순 평가가 아니다. '잘하고 있나?'를 확인하고, '더 잘하려면 어떻게 해야 하나?'를 고민하는 과정이다.

SLM의 프로세스는 다음과 같이 진행된다.

  1. SLA 계획 수립
  2. SLA 설계 및 체결
  3. 운영 및 모니터링
  4. 정기 평가 및 개선

그리고 이 과정에서 활용되는 문서들이 바로 서비스 카탈로그, 운영협약서(OLA), 서비스 품질 계획서, 서비스 리포트 등이다.

실제 현업에서는 이 SLM 단계를 분기별로 리뷰 미팅을 통해 진행한다. 특히 SLA 성과를 KPI로 관리할 때는, Penalty와 Incentive 체계를 함께 설정하는 것이 중요하다. 성과가 미달되면 감점, 목표를 초과하면 보상. 이 단순한 원칙이 서비스 품질을 유지하는 데 가장 효과적이라는 걸 여러 차례 경험을 통해 배웠다.

결론은 명확하다. 기준 없이 위탁하지 말자, 그리고 꼭 확인하자!

많은 조직이 아웃소싱을 하면서도, 정작 SLA나 SLM을 제대로 작성하지 않거나 관리하지 않는 경우가 있다. 그러다 문제가 생기면, "왜 이런 일이 생겼지?"라는 질문만 반복한다. 하지만 분명한 건, 기준이 없다면 책임도 없다는 점이다.

나는 지금도 신규 아웃소싱 계약이 생길 때마다 SLA 작성을 단순히 계약부서에 맡기지 않고, 실무자로서 하나하나 검토한다. ‘이 기준이 현실적인가?’, ‘측정이 가능한가?’, ‘문제가 생기면 우리가 이걸 근거로 대응할 수 있는가?’를 따져보는 것이다.

그리고 무엇보다, SLA는 문서가 아니라 소통의 도구라고 생각한다.

서로의 기대치를 명확히 하고, 불필요한 오해를 줄이고, 더 나은 서비스를 만드는 출발점. SLM은 그 출발점을 운영으로 연결해주는 다리다. 그 다리가 튼튼하지 않으면, 아무리 좋은 서비스도 언젠가는 무너진다.

반응형