본문 바로가기

POST/Insight

[첫번째]쿠버네티스 벤치마크 보고서 2024 — 비용 효율성, 안정성 그리고 보안

 

 

2023년 쿠버네티스 채택은 지속적으로 증가하였고, 클라우드 네이티브 전환에 대한 비중 역시 빠르게 증가하고 있습니다. 이런 클라우드 ,

쿠버네티스 전환으로 인해 담당 조직은 컨테이너화된 애플리케이션 배포, 관리, 확장을 자동화할 수 있게 되었으며 데브옵스와 플랫폼 엔지니어링 및 개발팀은 워크로드의 안정성, 보안, 비용효율성에 대해 더 엄격한 관리를 요구받고 있습니다.

 

2022년 페어윈즈는 약 10만개 이상의 쿠버네티스 워크로드 분석에 대한 “쿠버네티스 벤치마크 보고서 2022”를 처음 발행하여 보고서를 통해 조직이 컨테이너 구성, 개선 가능 영역을 이해하고 결과를 타사와 비교해 검토할 수 있도록 데이터를 제공하고자 하였습니다. 2024년 약 33만개의 워크로드 분석을 기반으로 보고서가 나왔습니다. 이번 글에서는 보고서를 통해 2024년 쿠버네티스 워크로드의 비용, 안정성, 보안을 효율화하기 위해 개선가능한 부분에 대해 살펴보겠습니다.

비용 효율성, 안정성, 보안에 대한 집중

2024년 분석 결과에 따르면 쿠버네티스 전반에 대한 워크로드 부하 효율성과 안정성은 크게 향상되었지만, 여전히 개선이 필요한 영역이 남아 있는 것으로 조사되었습니다.

 

비용 효율성

클라우드 비용 관리를 추구하는 조직들은 37%가 비용 효율성 향상을 위해 50% 이상의 워크로드의 컨테이너 사이징 최적화가 필요하다고 보고서에서 나타났습니다. 컨테이너 사용이 점점 일반화됨에 따라 조직들은 크기 조정이 워크플로의 일부가 되어야 한다는 점을 지적하고 있습니다. 팀은 개별 컨테이너 크기 조정이 필요한지 여부를 결정해야 합니다. 필요한 경우 개발자는 정확한 크기 조정 결정을 내리고 이를 가장 효과적으로 적용하는 방법을 알아야 합니다.

 

비용 효율성 측면에서 많은 조직들이 CPU 요청과 한도를 설정하고 있습니다. 2024년 조직의 57%는 10% 이하의 워크로드가 크기 조정이 필요합니다. 또한 최근 벤치마크는 조직의 30%가 효율성을 높이기 위해 컨테이너 크기 조정이 필요하다는 것을 보여주며, 여전히 많은 개선 필요 영역이 있음을 나타냅니다.

 

안정성

프로덕션 환경에서 실행되는 앱과 서비스의 경우 안정성이 매우 중요하지만, 주요 Kubernetes 구성 문제를 해결하는 것은 어려울 수 있습니다. 개발팀은 각 애플리케이션에 어떤 값을 할당해야 하는지 결정하는 데 어려움을 겪는 경우가 많습니다. 최근 분석에 따르면 약 65%의 조직이 전체 안정성에 영향을 미치는 라이브니스 및 레디니스 프로브가 누락되어 있다는 사실을 보여줍니다.

 

조직의 55%는 21% 이상의 워크로드에서 복제본(Replica)이 누락되어 있습니다. 복제본은 컨테이너의 안정성과 고가용성을 유지하는 데 도움이 되기 때문에 이는 문제가 됩니다. 일부 조직(30%)은 개선을 보여주고 있으며 워크로드의 10% 미만이 영향을 받습니다.

 

올해는 조직의 67%가 CPU 요청 누락으로 인해 11% 이상의 워크로드에 영향을 받았으며, 2023년 78%에서 감소했습니다. CPU 요청 한도를 설정하면 팟이 필요한 리소스에 액세스할 수 있음을 보장하여 안정성을 높이는 데 도움이 됩니다.

 

보안

Kubernetes는 기본적으로 안전하지 않은 것으로 유명하며, 잠재적인 보안 문제를 식별하기 위해 구성을 검토해야 합니다. 최신 보고서는 조직의 28%가 워크로드의 90% 이상을 안전하지 않은 기능으로 실행하고 있다는 것을 보여주며, 2023년 33%에서 감소했습니다.

 

또 다른 중요한 보안 설정은 오래된 Helm 차트 실행과 관련이 있습니다. 최신 데이터에 따르면 조직의 70%는 워크로드의 11% 이상을 이전 버전의 Helm 차트로 실행하고 있으며, 이로 인해 중요한 보안 패치가 누락될 수 있습니다. 올해 벤치마크 보고서에서 약 14가지의 보안 구성을 살펴보았습니다. (상세 내용은 보고서에서 확인 가능합니다)

 

  • Insecure capabilities
  • Writeable file systems
  • Privilege escalation allowed
  • Runs as privileged
  • Run as root allowed
  • Image vulnerability
  • Unscanned images
  • Outdated Helm charts
  • Outdated container images
  • API version deprecated
  • NSA hardening checks
  • Missing network policy
  • Missing pod disruption budget
  • Priority class not set

워크로드 최적화

보고서에 따르면 조직의 57%가 크기 조정이 필요한 워크로드가 10% 이하라는 것을 발견했습니다. 이는 대부분 조직이 조직 및 앱 서비스의 고유한 요구에 따라 시간이 지남에 따라 적절한 조정을 하고 있다는 것을 의미합니다. 그러나 조직의 37%는 여전히 컨테이너 크기 조정과 관련하여 상세한 조사가 필요한 워크로드가 50% 이상 존재하는 것으로 밝혀졌습니다. 클라우드 지출이 계속 증가함에 따라 효율성을 면밀히 주시하고 불필요한 지출을 피하기 위해 개선 영역을 찾는 것이 중요합니다.

 

Kubernetes 클러스터 전반에 걸쳐 비용 모니터링 및 관리

  • 컨테이너 크기 조정: Kubernetes 클러스터의 효율성을 최대화하려면 리소스 한도와 요청을 올바르게 설정하고 필요한 경우 다시 조정하는 것이 중요합니다. 
  • CPU 요청 누락: 비용 효율성에 대한 초점은 항상 주로 누락된 메모리 및 CPU 요청과 한도에 맞춰져 왔습니다.

그 외에 풀 요청 시점에 컨테이너 크기 조정 변경 사항을 처리하면 다음과 같은 다양한 이점을 얻을 수 있습니다:

  • 비용 절감: 프로덕션에 배포되기 전에 워크로드 크기를 조정하여 Kubernetes 컴퓨팅 리소스 낭비를 방지합니다. 대규모 Kubernetes 클러스터를 운영하거나 여러 클러스터를 운영하는 경우 이러한 전환은 상당한 비용 절감으로 이어질 수 있습니다.
  • 수정 비용 감소: 인프라 코드가 개발 중인 동안 과다 공급된 워크로드에 대한 경고를 받을 수 있다면 리소스 변경 비용이 훨씬 낮아집니다.
  • 성능 향상: 각 워크로드가 효율적으로 실행하는 데 필요한 리소스를 확보하면 응답 시간이 더 빠르고 오류가 적으며 더 나은 사용자 경험을 제공할 수 있습니다.
  • 안정성 향상: 부족하게 공급된 워크로드(즉, 메모리 또는 CPU 요청이 너무 적은 워크로드)는 정전, 성능 저하, 메모리 부족 오류(OOMKills) 가능성을 높일 수 있습니다.

2024년 쿠버네티스 워크로드 비용

클라우드의 프로덕션 Kubernetes 환경으로 더 많은 앱과 서비스를 이전함에 따라 워크로드가 얼마나 많은 리소스를 소비하는지 면밀히 살펴보는 것이 여전히 중요합니다. 동시에 이러한 워크로드가 안정적이고 사용 가능한 상태를 유지하는 것도 중요합니다.

 

1. 과도한 CPU 및 메모리 지출 영역 식별: 워크로드 리소스 요청 및 한도를 분석하여 사용 부족 또는 과도 공급된 리소스를 정확히 파악하고, 비용 할당 도구를 활용하여 개별 워크로드의 재무적 영향을 이해합니다.

 

2. 리소스 조정에 대한 통찰력 확보: 모니터링 솔루션을 구현하여 시간 경과에 따른 리소스 사용 추세를 추적하고 과거 데이터 및 예측 분석을 활용하여 조정이 필요한 워크로드를 식별합니다.

 

3. 성능 저하 없이 클라우드 지출 감소: 적절한 CPU 및 메모리 요청과 한도를 설정하여 워크로드 크기를 조정하며, 자동 확장 메커니즘을 구현하여 필요에 따라 리소스 할당을 동적으로 조정하고 개선된 리소스 효율성을 위해 컨테이너 이미지 및 구성을 최적화합니다.

2024 쿠버네티스 벤치마크 보고서에서 기억할 것

컨테이너와 Kubernetes는 기업에 큰 이점을 제공할 수 있지만, 이러한 필수 구성 요소를 이해하고 적절하게 설정하는 방법을 모르면 Kubernetes의 복잡성을 극복하기 어려울 수 있습니다. 이 보고서는 Kubernetes에서 잘못된 구성 가능성을 파악하고, 이러한 구성이 앞으로 1년 동안 워크로드의 안정성, 보안 및 비용 효율성에 미치는 영향을 측정하는 데 도움이 됩니다. 2024 Kubernetes 벤치마크 보고서(다운로드 클릭!) 전체를 다운로드하여 지난 1년간의 워크로드 보안 및 안정성 트렌드에 대한 심층적인 통찰력과 분석을 얻으세요.

 

 

Fairwinds 는 쿠버네티스 거버넌스와 가드레일을 제공합니다. 더 빠른 클라우드 네이티브 애플리케이션 배포와 비용 효율성을 강화하고 리스크는 감소합니다. Fairwinds Insights 를 통해 표준화 및 모범관행을 강제하여 개발자가 올바른 선택을 통해 셀프 서비스를 할 수 있도록 지원합니다. 플랫폼팀은 Fairwinds Insights를 통해 개발의 속도를 유지한채 생산성을 높일 수 있습니다. Fairwinds 에 대한 상세한 소개를 원하시면 한국 파트너 오에스씨코리아(클릭)에 문의 주세요.

 

 

 

참고링크:

2024 Kubernetes 벤치마크 보고서

https://www.fairwinds.com/news/2024-kubernetes-benchmark-report

https://www.fairwinds.com/blog/2024-kubernetes-benchmark-report-kubernetes-workload-analysis

웨비나 다시보기: https://youtu.be/j9McGY_huyE?feature=shared