[대한민국의 일상 멈춰 세운 ‘카카오 먹통’ 사태]
[단순 화재에 ‘국민메신저 먹통’… 재난 대비 ‘기본’ 안 된 카카오]
[테러 우려에 위치도 공개 안한다... ]

대한민국의 일상 멈춰 세운 ‘카카오 먹통’ 사태
국민 대부분이 사용하는 메신저 카카오톡이 10시간 넘게 불통되면서 택시 호출, 지도, 결제, 가상화폐 거래, 본인 인증 등 카카오를 기반으로 하는 각종 서비스가 멈춰서는 사태가 벌어졌다. 경기도 성남시 판교에 있는 SK C&C 데이터센터의 지하 전기실 화재로 이 데이터센터에 입주한 카카오의 서버 3만2000대 등이 가동 중단됐기 때문이다. 카카오가 자체 운영하는 서비스는 물론이고, 카카오톡을 활용한 개인 인증 기능, 연동된 정부 민원 서비스까지 몽땅 불통이었다. “대한민국 일상이 멈췄다”는 말이 나올 지경이었다. 급기야 윤석열 대통령이 상황실을 장관 주재로 격상하라고 지시했고 과기정통부 장관이 “서비스 장애로 국민이 불편을 겪게 된 데 막중한 책임을 느낀다”고 사과까지 했다.

15일 오후 카카오 데이터센터 입주한 경기 성남시 분당구 삼평동 SK판교캠퍼스에 화재가 발생했다. 화재는 진압이 됐지만 다음, 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 사진은 PC용 카카오톡의 오류 안내문. 2022.10.15/뉴스1
이번 사태는 ‘ICT(정보통신기술) 강국’ 대한민국이 한순간에 얼마나 취약한 사회로 전락할 수 있는지를 단적으로 보여줬다. 독점 메신저 기업 카카오에 의존한 초연결 사회가 작은 화재 하나로 초먹통 사회가 됐다. 카카오는 무료 카카오톡으로 이용자 수를 급격히 늘린 뒤 전방위로 비즈니스를 확장해 계열사를 136개나 거느리게 된 시가총액 22조원의 공룡 플랫폼 기업이다. 택시 호출 서비스의 90%를 장악했고 쇼핑, 결제, 콘텐츠 산업, 금융업까지 진출했다. 하지만 회사 키우고 시장 장악하는 데만 급급했을 뿐 ICT기업으로서 가장 중요하게 여겨야 할 서버의 안전한 관리와 재난 복구 대응에서는 허술하기 그지없는 모습을 드러냈다. 네이버 등 다른 입주 기업과 달리, 카카오는 화재 발생 하루가 넘도록 서버 3만2000대 가운데 절반도 복구가 안 된 상태다. 완전 복구는 언제가 될지 알 수 없는 상황이다.
4차 산업혁명 시대에 데이터센터는 국가 기간 시설 못지않게 중요한 보안 시설이다. 화재, 천재지변, 테러 등 어떤 사태에도 데이터센터가 안전하게 가동되어야 한다. 공간을 빌려준 SK C&C는 지하 3층 전기실에서 화재가 발생하자 3분 뒤 전원을 차단해 모든 서버 가동을 중단했다. 국민 피해가 눈덩이처럼 커지는데 사태에 책임 있는 두 대기업은 서로 남탓을 하며 책임을 떠넘기기 바빴다. 위기 대응에 취약한 민낯을 드러낸 이번 사태를 계기로 ICT 시스템 장애와 이로 인한 피해를 막기 위한 방안을 민관이 합동으로 전면 재점검해야 한다. 이중 삼중 안전 장치를 마련하고 재난 대응 매뉴얼을 최신화하도록 제도 개선이 이루어져야 한다.
-조선일보(22-10-17)-
____________
○ 주말 카카오 먹통에 여야 성명 통한 정쟁도 휴전. 사실은 여야 모두 키보드 워리어였나.
-팔면봉, 조선일보(22-10-17)-
_____________
단순 화재에 ‘국민메신저 먹통’… 재난 대비 ‘기본’ 안 된 카카오

카카오 데이터센터 화재 15일 오후 경기 성남시 분당구 삼평동 SK판교캠퍼스에서 불이나 소방대원들이 현장을 살피고 있다. 이날 오후 카카오 등 데이터 관리 시설이 입주해있는 이 건물 지하에서 불이나면서 카카오톡, 카카오택시 등 일부서비스에 장애가 빚어지고 있다. 2022.10.15 뉴스1
지난 주말 경기 성남시 SK C&C 판교데이터센터에서 발생한 화재로 이곳에 서버를 둔 카카오 서비스가 장시간 멈추는 초유의 사태가 발생했다. 카카오톡 모바일 기능은 어제 새벽 일부 복구가 됐으나 나머지 서비스는 오후가 되도록 완전히 정상화되지 않았다. 실사용자 수가 4750만 명인 데다 다른 서비스의 관문 역할을 하는 카톡이 먹통이 되면서 전국 곳곳에서 피해가 속출했다.
이번 카톡 대란의 직접적인 원인은 부실한 화재 대응이다. 서버 임대 공간이 아닌 전기실 화재로도 서버 전원을 내려야 할 정도로 데이터센터는 화재에 취약하다. 그런데도 카카오 측은 “화재는 워낙 예상 못 한 시나리오여서 대책이 부족했다”고 했다. 2014년 삼성SDS 과천 데이터센터에서 화재가 발생했고, 2018년 KT 서울 충정로 아현지사에서 불이 나 인근 지역 유무선 통신이 먹통이 된 적도 있다. 가장 흔한 재난인 화재를 예상 못 했다니 황당한 변명일 뿐이다.
서버에 문제가 생겨도 예비 서버만 정상적으로 작동하면 서비스 장애는 일어나지 않는다. 주요 정보기술(IT) 업체들이 데이터센터를 이원화하는 이유다. 카카오 측은 “(재난재해 대응을 위한) 이원화 시스템을 가지고 있다”고 해명했지만 가장 단순한 카톡 일부 기능을 정상화하는 데도 10시간이 걸렸다. 지진이나 테러가 발생한 것도 아니고 단순 화재에도 작동하지 않는 시스템이 무슨 의미가 있나.
카카오는 벤처기업 시절인 2012년에도 데이터센터 전력 공급이 끊겨 서비스가 4시간 중단된 적이 있다. 그때도 서버를 분산 운용하지 않았다는 비판이 나왔다. 카카오는 이후 10년간 계열사 수를 130여 개로 늘리면서 카카오로 소통하고, 택시 잡고, 결제하는 국민 메신저로 자리 잡았다. 하지만 덩치를 키우는 동안 가장 기본적인 데이터센터에는 투자를 소홀히 하다 전국을 마비시키는 사태를 초래한 것이다.
화재가 발생한 데이터센터에 서버를 둔 네이버도 카카오만큼은 아니지만 일부 서비스에서 접속 장애 현상이 발생했다. 데이터 경제 시대에 모든 데이터를 모아놓는 데이터센터의 안정적인 운영이 더욱 중요해졌다. 글로벌 IT 기업들은 대규모 정전으로 데이터센터 전체가 마비되는 극단적 상황까지 가정해 대응 훈련을 한다. 비상사태에 대비한 매뉴얼을 재정비하고, 주요 IT 기반시설인 데이터센터를 재난과 사이버 공격으로부터 안전하게 보호하는 방안도 모색해야 한다.
-동아일보(22-10-17)-
__________
테러 우려에 위치도 공개 안한다...
‘서버 호텔’ 데이터센터의 모든 것
[카카오 먹통 대란]
‘핵심 보안시설’ 국내 데이터센터 156곳… 구글, 年2회 재해 대비훈련
4차산업 성장동력 폭발적 증가하는데

구글의 데이터센터-미 오리건주 더 댈러스에 위치한 구글 데이터센터에서 한 직원이 서버(대형 컴퓨터) 장비를 검사하고 있다. 이 센터는 구글의 이메일, 사진, 비디오, 캘린더 등 각종 서비스 관련 데이터를 저장, 처리하는 곳이다. /구글
카카오 서비스 장애의 원인이 카카오가 임대해 사용하는 데이터센터 화재와 전원 차단이었다는 점이 밝혀지면서, 데이터센터에 대한 관심이 높아지고 있다. 사실 데이터센터는 구글·아마존·마이크로소프트 등 글로벌 테크 기업들이 앞다퉈 투자를 늘리는 핵심 사업 분야다. IT 업계에선 “데이터센터를 빼놓고는 어떠한 성장 사업도 이야기할 수 없다”는 말이 있을 정도다.
◇대규모 ‘서버 호텔’ 데이터센터
최근 IT 서비스를 운영하는 기업들과 이를 활용하는 개인들은 사용자의 로그인 기록이나 데이터, 각종 결과물을 개별 컴퓨터에 저장하기보다는 인터넷을 통해 외부의 더 빠르고 성능 좋은 서버에 저장한다. 원활한 서비스를 위해서다. 이러한 대형 서버들을 한곳에 모아 놓은 물리적 공간이 바로 데이터센터(Data Center)다.

2021년 기준 전 세계에는 1851개의 데이터센터가 있다. 특히 면적이 2만㎡ 이상으로 ‘하이퍼스케일’이라고 부르는 초대형 데이터센터는 전 세계에 659개(2021년 기준)가 있다. 보통 이러한 초대형 데이터센터 1곳에는 서버가 최소 10만대 이상 있다. 이 때문에 데이터센터는 ‘서버 호텔’이라고 불린다. 데이터센터가 없으면 대규모 데이터를 저장하고 처리할 수 없다. 데이터센터를 4차 산업혁명 시대 핵심 인프라로 꼽는 이유다.
데이터센터는 크게 구분해 2가지 종류가 있다. 개별 IT 업체가 사업을 운영하며 자체적으로 만든 것이 첫째다. 네이버가 춘천에 지었고, 세종시에 또 짓고 있는 데이터센터 ‘각’이 대표적이다. 이는 개별 기업이 자사 서비스와 관련된 데이터를 직접 관리한다. 다른 하나는 구글·아마존·마이크로소프트 등 대형 테크 기업이 데이터센터를 만들고, 이를 다른 IT 기업에 빌려주는 형태다. 이를 ‘클라우드 서비스’라고 한다. 직접 데이터센터를 구축하기엔 비용이 많이 들고, 관리가 복잡하기 때문에 많은 기업들이 구글·아마존·마이크로소프트 등에 돈을 내고 클라우드 서비스를 이용한다. 이번 사태의 경우 카카오가 SK C&C가 만든 데이터센터를 이용한 것이다.

데이터센터 발화 지점-지난 15일 경기 성남시 SK C&C 판교캠퍼스(데이터센터) 화재가 처음 발생한 지점으로 경찰이 추정하고 있는 지하 3층 전기실의 UPS(무정전 전원 장치)가 불에 탄 모습. /이기인 경기도의원
◇폭발 성장하는 데이터센터
데이터센터는 IT 산업이 발전하면서 폭발적으로 증가해왔다. AI(인공지능), 5G(5세대 이동통신), 자율주행, AR·VR(증강·가상현실) 등 첨단 테크가 IT 분야에 다방면으로 적용되면서 데이터 사용량이 급증하고, 이를 저장 및 처리하는 데이터센터도 크게 늘어났다.
시장조사업체 IDC에 따르면 2016년 전 세계 데이터 사용 총량은 16.1ZB(1ZB는 1조 기가바이트)였으나 2025년엔 그 10배인 163ZB가 될 것으로 전망된다. 이에 따라 전 세계 데이터센터 시장도 폭발 성장 중이다. 2016년 2505억1000만달러(약 361조4000억원)이었던 글로벌 데이터센터 시장은 2027년 4104억2000만달러(약 592조원)가 될 것으로 예상된다. 국내도 마찬가지다. 현재 네이버·통신 3사를 포함한 국내 기업과 에퀴닉스, 디지털리얼티 등 글로벌 데이터센터 기업들은 국내에 대규모 데이터센터를 짓고 있다. 2000년 53개에 불과했던 국내 데이터센터는 2020년 156개로 늘었고, 2025년엔 188개가 될 것으로 보인다.
데이터센터의 성장은 클라우드 사업을 진행하는 구글과 아마존 등의 실적에서도 드러난다. 광고 매출이 감소하며 전체 매출이 줄어드는 가운데서도 클라우드 사업은 매년 두 자릿수 성장을 기록하고 있다. 지난 2분기 아마존은 주력 사업인 전자 상거래 부문 매출이 1년 전에 비해 4% 감소했지만, 클라우드 사업은 1년 전보다 33% 증가했다.
◇온도·습도 등 까다롭게 관리해줘야
데이터센터는 서버를 비롯한 네트워크, 저장 공간인 스토리지, 메모리 반도체, 전력 공급·냉각 시설 등으로 구성된다. 수많은 데이터를 저장하고 24시간 돌아가는 서버의 효율을 높이기 위해 데이터센터는 온도와 습도 등 작은 부분도 민감하게 관리한다. 대용량 서버가 밀집한 공간은 항상 섭씨 21~27도를 유지한다. 서버 성능이 최고로 발휘되는 온도다. 이 온도를 유지하기 위한 전력 소비량도 엄청나다.
최근 마이크로소프트와 메타(페이스북)는 이 때문에 데이터센터를 특별한 곳에 짓는 실험을 하고 있다. 마이크로소프트는 2018년부터 2년간 스코틀랜드 오크니섬 인근 바다에 해저 데이터센터를 만들어 시험했다. ‘전기 먹는 하마’로 불리는 데이터센터를 북해의 차가운 바닷속에 통째로 집어넣어 서버의 열을 자연 냉각시켰다. 데이터센터 운영에 필요한 전력은 조력과 파력 발전으로 조달했다. 메타는 2016년 바람이 많이 부는 아일랜드 클로니 지역에 데이터센터를 지었다. 찬 바람을 활용하겠다는 전략이다.
◇데이터센터는 핵심 보안 지역
사용자들의 개인 정보와 데이터를 처리하는 데이터센터는 특급 보안 시설이다. 출입 제한이 엄격하고, 정확한 위치도 대외적으로 공개되지 않는다. 테러의 위험을 차단하기 위해서다.
화재나 천재지변으로 데이터센터가 피해를 받으면 여기에 저장된 고객 데이터가 날아가, IT 업체 입장에선 사업을 영위하기 불가능해진다. 작년 3월 유럽 최대 클라우드 서비스 업체인 OVH클라우드의 데이터센터에서 대형 화재가 발생했는데 당시 이 데이터센터를 이용했던 게임 개발사 페이스펀치는 게임 사용자 데이터 대부분을 잃었고 정상적인 운영이 불가능해졌다.
데이터센터를 운영하는 업체와 이를 이용하는 업체들은 자체적으로 DR(Disaster Recovery·재해 복구) 계획을 마련한다. 지진이나 화재, 테러, 기술적 문제 등 예상치 못한 비상사태가 발생할 경우 즉시 투입되는 인력 구성, 전력 공급이 끊어질 경우를 대비한 자체 비상 전력 확보 방안, 재해 복구 목표 시간, 해킹을 막는 보안 조치, 백업과 복원 절차 등이 DR에 반드시 포함된다.
재해의 상황을 가정한 비상 복구 훈련도 정기적으로 진행한다. 구글의 경우 1년에 2번 이상 재해 복구 계획을 테스트하고 있다고 밝혔다. 실리콘밸리의 네트워크 기업에 다니는 한 엔지니어는 “데이터센터를 구성할 때는 재해를 대비해 물리적으로 다른 곳의 데이터센터에 백업 데이터를 실시간으로 구축하는 것이 기본 중의 기본”이라며 “전 세계 모든 기업들이 이러한 백업 데이터센터를 이중으로 구성하는 추세인데, 이번 한국의 카카오 사태는 쉽게 이해되지 않는다”라고 했다.
-실리콘밸리=김성민 특파원, 조선일보(22-10-17)-
=====================
'[세상돌아가는 이야기.. ] > [時事-萬物相]' 카테고리의 다른 글
| [교육부는 왜 밉보였나] [학력 진단이 죄악인가] (0) | 2022.10.18 |
|---|---|
| [‘김일성주의자’ 발언이 뜻하는 것] [진보의 수치 ‘문재명’] .... (1) | 2022.10.18 |
| [김정은은 .. 무슨 생각을 할까] [제 자식이라도 그럴까.. ] (0) | 2022.10.17 |
| [전광용·채만식 소설로 돌아본 이 풍진 세상의 기회주의자들] (0) | 2022.10.16 |
| [“탈냉전 끝났다”며 中 봉쇄 ‘10년 대결’ 선언한 美 안보전략].... (0) | 2022.10.15 |