자료실

Presentation

MSAP.ai 자료실에서 MSAP.ai의 최신 Presentation을 만나보세요. 다양한 콘텐츠와 전문 지식을 통해 더 나은 경험을 제공합니다.

코드 수정 없이, 쿠버네티스 운영 상태를 한눈에 보는 방법(MSAP.ai Observability) – 자료 다운로드

eBPF로 데이터를 자동 수집하고 AI가 장애 원인까지 분석해주는 쿠버네티스·MSA 통합 모니터링 플랫폼 소개 자료입니다.

2026년 06월 17일

observability

자료 다운로드

🗂️전체 발표자료(PDF)를 다운로드 받고싶으시다면 아래 설문을 제출해주세요!

(필수) 개인정보 수집 및 동의

MSAP.ai는 오픈마루와 투라인클라우드가 공동 운영하는 브랜드로, 본 서비스 이용 과정에서 수집된 개인정보는 양사(오픈마루 및 투라인클라우드)가 공동으로 수집 및 관리하며, 아래의 목적에 따라 이용됩니다.
※ 오픈마루 및 투라인클라우드는 MSAP.ai 브랜드의 공동 운영사입니다.
개인정보 수집·이용 내역
수집 항목 회사명, 성명, 직급/직책, 연락처, 이메일
수집 목적 - 서비스 이용에 대한 문의 응대 및 관련 정보 제공
- 교육, 세미나, 이벤트 등 참가 신청 접수 및 운영
- 뉴스레터, 제품 안내 등 마케팅 정보 제공
보유 및 이용기간 서비스 이용 문의 접수일로 부터 5년간 보관
* 귀하는 위 개인정보 수집 및 이용에 대한 동의를 거부할 권리가 있으며, 다만 동의하지 않을 경우 서비스 제공 및 관련 안내에 제한이 있을 수 있습니다.

소개: 마이크로서비스로 빨라진 만큼, 장애 추적은 더 어려워졌다

시스템을 여러 개의 마이크로서비스로 나누면서 배포 속도는 빨라졌지만, 하나의 요청이 어느 서비스에서 지연되는지, 어떤 서비스가 어떤 서비스를 호출하는지를 외부에서 추적하기는 더 어려워졌습니다. 응답 코드가 정상(HTTP 200)으로 보여도 서비스 사이에서 무슨 일이 벌어지는지는 확인하기 힘든 사각지대로 남습니다.

MSAP.ai Observability는 이 사각지대를 eBPF 기술로 자동 수집해 들여다보고, 메트릭·분산추적·로그·프로파일링을 하나의 플랫폼에 통합한 뒤, Cogent AI가 원인과 조치까지 자연어로 제시하는 AI Native 모니터링 플랫폼입니다.

이 자료를 통해 그 개념부터 실제 장애 대응 시나리오까지 확인하실 수 있습니다.

발표 자료 주요 내용

  • 왜 Observability가 필요한가? – 35년간 관리 대상이 1,000배로 늘고 마이크로서비스 내부가 사각지대가 된 배경
  • SRE와 모니터링의 기본기 – SRE 개념, SLI·SLO·SLA, 에러 예산, 그리고 관측의 4요소(메트릭·분산추적·로그·프로파일링)
  • MSAP.ai Observability란 – Zero-Instrument·eBPF·Cogent AI의 핵심 요약과 시스템 아키텍처, 통합 워크플로
  • 핵심 기능 살펴보기 – 토폴로지 맵, SLO 모니터링, 분산추적, 프로파일링, 로그·배포·인시던트 관리
  • 차별점과 도입 효과 – 기존 APM과의 9가지 비교, MTTR·비용·생산성 개선 효과
  • 실제 활용 사례 – 메트릭·로그 분석, 차트 예측, 그리고 결제 장애를 AI가 분석해 푸는 과정

이 자료의 핵심 장표

1. MSAP.ai Observability 개요

observability

핵심은 두 가지로, MSAP.ai Observability는 eBPF 기술로 커널 레벨의 통신을 자동 수집하기 때문에 코드를 전혀 수정할 필요가 없다는 점과, Cogent AI가 차트나 로그 화면 어디서든 버튼 한 번으로 원인을 분석해준다는 점입니다. 에이전트 하나만 설치하면 되고 Java·Go·Python 등 8개 이상 언어를 지원한다는 정보까지 한 장에 담겨 있어, ‘자동 수집 + AI 분석’이라는 제품의 정체성을 가장 빠르게 확인할 수 있습니다.

2. 토폴로지 맵 (eBPF 자동 서비스 맵)

observability

코드를 수정하지 않고 어떻게 전체 구조가 보이는가”라는 의문을 풀어주는 장표입니다.

노드에 에이전트 하나만 설치하면 모든 서비스 간 통신을 자동으로 파악하고, 서비스가 새로 생기거나 사라질 때마다 맵이 즉시 갱신되며 상태를 색상으로 구분해줍니다. 응답시간·요청수·오류율을 맵 위에서 바로 확인할 수 있고, 오류가 발생한 노드에서 분산추적·로그·프로파일링 화면까지 클릭만으로 이어집니다.

3. 기존 APM과 9가지 기준 비교

observability

도입을 검토하는 사람이 가장 먼저 던지는 “기존 도구와 무엇이 다른가”라는 질문에 답하는 장표입니다.

계측 방식, 커버리지, 도입 시간, AI 분석, 근본원인분석(RCA) 등 9개 기준을 표로 나란히 비교합니다. 예를 들어 기존 APM은 언어별 SDK를 코드에 삽입해야 하지만 MSAP.ai는 eBPF 기반 제로 계측이고, 도입 시간도 수 주~수 개월에서 수 시간(Helm 설치)으로 줄어듭니다. 차별점을 직관적으로 비교해볼 수 있습니다.

4. Cogent AI 사용법·분석 대상·도입 효과

observability

이 자료의 정체성인 ‘AI Native’가 실제로 무엇을 의미하는지 확인할 수 있는 장표입니다.

지표 확인 → 버튼 클릭 → AI 분석 결과까지 단 3단계로 끝나며, 차트·로그·감사 로그 등 모니터링 전 영역에 AI 분석이 적용됩니다. 도입 효과로는 분석 시간이 수 시간에서 수 초로 단축되고, 고급 엔지니어만 가능하던 분석을 누구나 할 수 있게 되며, 장애 대응이 사후에서 사전 예방으로, 운영 지식이 개인 역량에서 조직 자산으로 전환된다는 점을 제시합니다.

5. 활용 사례: 결제 장애 RCA (MTTR 45분→5분)

observability

추상적인 기능 설명이 아니라 실제 장애 시나리오와 수치로 가치를 증명하는 장표입니다.

결제 서비스가 30초 이상 지연되는 상황에서 시스템이 SLO 위반을 감지하고, 의존성 그래프를 자동으로 순회해 근본 원인(Kafka 컨슈머 LAG 급증)을 찾아낸 뒤, “인스턴스 2→4 증설”이라는 조치까지 권고하는 과정을 단계별로 보여줍니다. RCA 보고서와 Postmortem 초안까지 자동으로 생성되며, 평균 MTTR이 45분에서 5분으로 줄어든 결과로 마무리됩니다.

이런 분께 추천드립니다

  • 쿠버네티스·MSA를 운영하지만 내부 흐름이 보이지 않아 어려움을 겪는 SRE·인프라 운영자 – 토폴로지 맵과 분산추적으로 사각지대를 없애려는 분
  • 장애가 발생할 때마다 어디부터 봐야 할지 막막한 운영팀 – RCA 자동화로 MTTR을 단축하려는 분
  • APM·모니터링 도구가 여러 개로 나뉘어 도구 전환에 피로를 느끼는 팀 – 메트릭·분산추적·로그·프로파일링을 하나의 플랫폼으로 통합하려는 분
  • AI를 실제 운영에 적용해보려는 의사결정자 – AI Native·VibeOps가 현장에서 어떻게 작동하는지 확인하려는 분
  • SDK 계측과 재배포 부담 없이 빠르게 도입하려는 팀 – 코드 수정 없이 수 시간 내 모니터링을 시작하려는 분

마무리 – 에디터 노트

모니터링의 핵심은 결국 겉으로는 정상으로 보여도 내부에서 일어나는 문제를 놓치지 않는 데 있습니다. MSAP.ai Observability는 코드를 수정하지 않고 그 내부를 자동으로 들여다보고, AI가 원인까지 제시하는 방식으로 이 문제를 해결합니다. 자료에는 개념 설명부터 실제 장애를 5분 만에 해결하는 시나리오까지 담겨 있어, 쿠버네티스 운영의 다음 단계를 고민하는 팀이라면 이 자료를 추천드립니다.

Share This Story, Choose Your Platform!

Go to Top