본문 바로가기

Chaos Engineering

(4)
Chaos Engineering 영역에서 Observability (관측 가능성) National Australia Bank 사례 원문보기 사이트 신뢰성 훈련, 구체적으로 Chaos Engineering이 최근에 대세가 되었으며, Netflix와 Google 엔지니어링팀에서 작은 웹사이트의 SRE 엔지니어에 이르기까지 신뢰성은 성공의 중요한 척도입니다. 신뢰할 만한 서비스와 제품은 관측 가능한 데이터를 요구할 뿐 아니라 분석 및 실행 가능한 통찰력을 필요로 합니다. Chaos Engineering 훈련에 있어 관측 가능성은 중요한 역할을 합니다. 가설에 대한 검증, 정상상태의 동작, 실제 환경의 이벤트에 대한 모의실험, 공격 반경 등이 모두 관측 가능성이 중요한 역할을 하는 실험 단계입니다. 단순히 말하자면, ChaosEngineering – 관측 가능성 = Chaos(혼돈)라고 할 ..
[클라우드 임팩트 2021] 그렘린-OSC, “백신 맞듯 카오스 엔지니어링으로 장애 선제 대응” 2021년 06월 18일 디지털데일리 원문보기 [디지털데일리 백지영기자] “마이크로 서비스 아키텍처(MSA) 등 매우 복잡하게 구축된 시스템에서 전통적인 테스팅은 충분치 않습니다. 엔지니어에게 실제 장애 상황에 대응할 기회를 줘야 합니다, 10년 전 넷플릭스에 ‘카오스 몽키’가 만들어진 이유이기도 합니다.” 17일 디지털데일리 DD튜브에서 개최된 ‘클라우드 임팩트 2021’ 버추얼 컨퍼런스에서 콜튼 앤드러스 그렘린 최고경영자(CEO)는 “마치 코로나 상황에서 백신을 맞고 예전과 비슷한 생활로 돌아갈 수 있듯, 우리가 배포하는 시스템에도 백신을 주입해 장애를 미리 테스트해 대응할 수 있는 방법을 가르치는 것이 필요하다”고 강조했다. 그렘린은 장애를 시뮬레이션하고 이에 대한 취약적을 분석해 대응책을 마련해주..
비대면 디지털 전환과 케이오스 엔지니어링 백신 개발과 보급이 박차를 가하고 있지만, 코로나19 아직도 현재 진행형이다. 크게는 전세계 경제, 교역, 관광등의 산업이 정지되었고 작게는 모든이들의 평범한 일상을 앗아갓다. 지금 이 순간에도 3차 유행이라고 불려질만큼 전세계적으로 확진자가 폭증하고 있고 세계 각국들은 봉쇄령이라는 최후의 카드를 꺼내들고 있다. 우리나라도 코로나19 유행 초기에는 확진자 수 세계 2위를 기록하기도 했지만 검사-추적-치료를 골자로한 소위 말하는 K-방역으로 이동제한이나 의료시스템의 붕괴 없이 코로나 확산을 통제하고 있어 세계적으로 주목 받고 있다. 외신들로부터 모범적이라고 극찬받고 있는 현재 우리나라의 감염병 대응 시스템은 2015년 메르스 방역 실패의 교훈으로 탄생되었다고 볼수있다. 186명이 감염되고 그 중 38명이 ..
Introducing Gremlin Scenarios: Reproduce Real-World Outages 원문보기