정부, SK C&C, 카카오, 네이버 등에 한달내 원인 개선·향후 계획 보고 요구
정부, SK C&C, 카카오, 네이버 등에 한달내 원인 개선·향후 계획 보고 요구
  • 정단비
  • 승인 2022.12.07 14:16
  • 댓글 0
이 기사를 공유합니다

판교데이터센터 화재 및 부가통신서비스 장애 조사 결과 발표
디지털 서비스 안정성 확보 종합 개선방안 내년 1분기 수립 계획

과학기술정보통신부는 방송통신위원회, 소방청과 함께 지난 10월 15일 SK C&C 판교 데이터센터 화재 및 카카오·네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표하고, SK C&C, 카카오, 네이버 3사에게 1개월 이내 주요 사고원인에 대한 개선 조치와 향후 계획을 수립해 보고하도록 할 계획임을 밝혔다.

이날 SK C&C 판교데이터센터 화재 및 카카오, 네이버 등 부가통신서비스 장애에 대한 조사 결과를 발표한 이 장관은 “이번 결과를 바탕으로 유사 사고의 신속한 예방 및 재발 방지를 위해 단기 조치 사항은 각 사가 선제적으로 조치하도록 한다.”며 이같이 말했다.

그러면서 “각 사가 제출한 조치 결과과 향후 계획 및 재난예방·복구에 대한 의견 등은 추후 정책방안 마련에 반영할 계획”이라고 전했다.

아울러 “방송통신위원회 역시 카카오 등에 대해 피해접수 전담 창구 개설 등 실질적인 피해 구제의 방안을 수립·이행토록 했으며, 향후 통신장애 시 실효성 있는 이용자 고지와 피해 규제를 위한 법령 등 개선방안을 마련하겠다.”고 덧붙였다.

한편, 지난 10월 15일 SK C&C 판교 데이터센터 지하 3층 배터리실에 화재가 발생해 카카오와 네이버 등 입주기업 서비스에 장애가 발생했다.

판교 데이터센터는 화재진압 후 순차적으로 전력공급을 재개해 19일 새벽 5시부터 전력공급을 정상화했는데, 서비스 장애 및 이용자 피해가 가장 광범위했던 카카오는 장애 복구에 127시간 33분이 소요됐다.

이에 정부는 사고 직후 방송통신재난 대책본부를 구성·운영해 신속한 장애 복구를 독려하고 원인을 조사했다. 이어 분석 결과에 따라 SK C&C, 카카오, 네이버 3사에 대해 책임있는 조치 및 대책마련 등 후속조치를 시행하기로 했다.

정부는 이번 사고로 국민이 입은 피해의 신속한 복구와 재발 방지를 위해 각 사업자의 선제적인 조치 이행이 필요하다고 강조했다.

이에 따라 SK C&C와 카카오, 네이버 3사에게 1개월 이내로 주요 원인에 대해 개선 조치를 하거나 향후 조치계획을 수립해 방송통신재난 대책본부에 보고하도록 행정지도를 추진하기로 했다.

먼저 SK C&C에는 배터리모니터링시스템 계측정보 등 관리 강화 방안 및 현 배터리 모니터링 시스템 외의 다양한 화재감지 시스템 구축 방안 수립을 요구했다.

또한 리튬이온 배터리 화재 때 필요한 소화설비 등의 구축 또는 불가능할 경우 대안 마련을 주문했다.

데이터센터 전력공급의 생존성 확보를 위해 배터리와 기타 전기설비 간 물리적 공간을 분리하고, 배터리실 내에 위치한 전력선을 재배치해 구조적 안정성을 확보하거나 대안 조치를 강구하도록 했다.

화재 등 재난 발생 구역의 전력을 개별 차단할 수 있는 방안도 마련하고, 재난 현장에 직접 진입하지 않고도 해당 구역의 전력 차단 등 조치를 할 수 있도록 다양한 방안 수립도 요구했다.

아울러 현실적인 재난대응 시나리오 개발 및 세부 훈련 계획 수립해 모의 훈련을 실시하고 결과를 보고하도록 했다.

㈜카카오에는 카카오 서비스 장애 복구 지연의 핵심 원인인 ‘운영 및 관리도구’를 데이터센터 간 Active-Active 등 매우 높은 수준의 다중화를 적용할 것을 요구했다.

핵심 기능에 대해서는 우선순위와 중요도 등을 고려해 현재보다 높은 수준의 분산 및 다중화를 적용할 수 있는 방안 수립을 주문했다.

특히 데이터센터 전소 혹은 네트워크 마비 등 최악의 상황을 대비한 훈련 계획을 수립하고 모의 훈련을 실시해 보고해야 한다.

신속한 장애 복구를 위해 서비스별 복구목표 설정과 상시 대응조직 구성, 장애 시나리오별 복구방안을 수립하고 장애 탐지-전파-복구 모든 단계의 복구체계를 재점검해 자동화 기능 요소 발굴 등 개선방안도 수립해야 한다.

서비스 장애 발생 시 다양한 방식으로 신속하게 이용자에게 고지할 수 있는 체계를 구축하고 이번 장애와 관련된 국민 피해를 구제하기 위한 원칙과 기준을 설정하고 보상 계획 수립을 주문했다.

네이버㈜에 대해서는 보다 철저한 장애 예방과 신속 복구를 위해 서비스별 복구 목표와 장애 시나리오별 복구 방안 등을 재점검해 개선방안을 마련하고, 주 데이터센터 전소 등 상황을 가정한 모의 훈련을 실시해 보고할 것을 요구했다.

이종호 과기정통부 장관은 “이번 사고에 원인을 제공한 사업자들은 이를 엄중히 인식하고 피해 복구 및 재발 예방에 최선의 노력을 다함으로써 디지털서비스에 대한 국민 신뢰를 다시 회복할 수 있기를 바란다”면서 “정부도 주요 디지털서비스에 대한 재난대응체계를 원점에서 재검토하고, 디지털 시대에 맞는 안정성 강화방안을 마련해 끊김없는 디지털서비스를 제공할 수 있는 확고한 디지털 위기관리 체계를 구축해나가겠다.”고 강조했다.

한편, 과기정통부는 1개월 후 3사가 제출한 조치결과 및 계획과 전문가·사업자 의견, 법·제도 개선사항 등을 반영해 디지털서비스 안정성 확보를 위한 종합적 개선방안을 내년 1분기 중으로 수립할 계획이다.