본문 바로가기

전체 글30

[???] Prometheus + Grafana로 실시간 모니터링하기 오랜만에 블로그 포스팅 및 업무 관련 사용한 툴들 기록하기시작 최근에 시작한 프로젝트에서 맡은 역할이 백엔드(기능개발 + 운영 + 관리)다.. 백엔드 기능을 구현하면서 세션같은 재밌는(?)것도 공부했고, 적용도 했는데 이런건 다음에 올려야겠다. 먼저, 가장 최근에 구현한 프로메테우스 + 그라파나 도구로 실시간 리소스 데이터 수집 + 시각화를 진행했다. 간단하게, Prometheus는 애플리케이션이나 시스템의 다양한 메트릭을 수집하는 오픈소스이며, Grafana는 Prometheus와 연동해서 수집한 메트릭을 이용해 실시간 대시보드를 구축하는 도구이다. 여기서, 메트릭은 서비스, 성능, 상태등 지표를 낼 수 있는 값들을 측정할 수 있다.메트릭 이름, 메트릭 측정된 타임스탬프(시간), 측정된 메트릭 값의 정.. 2024. 9. 9.
[2] 데이터 탐색 & 분석 데이터 탐색 탐색 부분은 적재된 데이터를 가공하고 데이터를 이해하는 단계다. 데이터 이해란, 데이터 패턴, 관계등 찾기인데 이를 EDA라 한다. 빅데이터 웨어하우스는 크게 3개로 구성된다. 빅데이터 레이크, 빅데이터 웨어하우스, 빅 데이터 마트이다. 빅데이터 레이크는 수집 부분에서 Flume, Storm등에서 수집한 크고 작은 반정형, 비정형 데이터가 축적되는 곳이다. 빅데이터 레이크에서 데이터가 가공되면, 빅데이터 웨어하우스가 된다. 빅데이터 웨어하우스는 반정규화 Hive 모델이라고 부르기도 하며, EDA가 가능한 부분이며, EDA를 통한 집계, 요약으로 빅데이터 마트를 만든다. 빅데이터 마트는 분석 주제 영역별로 나눌 수 있고, 컬럼지향 Hive 모델이다. 그래서 빅데이터 레이크에서 추출하고, 빅데이.. 2023. 12. 4.
[1] 프로젝트 아키텍처 구성 & 데이터 수집 및 적재 파일럿 프로젝트의 데이터는 실시간으로 생성되는 로그 데이터인 운전자 운행 정보와 일 단위로 적재되는 대용량 로그 파일인 차량 상태 정보로 구성되어 있다. 따라서, 프로젝트의 전체적인 단계는 데이터의 도메인 이해 데이터 수집 데이터 적재 데이터 탐색 및 분석 으로 진행된다. 데이터 정보는 아래와 같다. 데이터 1 차량의 다양한 장치로부터 발생하는 로그 파일을 수집해서 기능별 상태 점검 데이터 발생 위치 : 100대 시범 운행 차량 데이터 종류 : 대용량 로그 파일 발생 주기 : 3초 수집 주기 : 24시간 수집 규모 : 1MB/1대 (총 : 100MB) 처리 유형 : 배치 데이터유형 : CSV(Text, UTF-8) 데이터 2 운전자의 운행 정보가 담긴 로그를 실시간으로 수집해서 주행 패턴 분석 데이터 발.. 2023. 12. 1.
[Chapter 1] 데이터 엔지니어링 이 책에서는 다음과 같이 데이터 엔지니어링과 데이터 엔지니어를 정의한다. 데이터 엔지니어링은 원시 데이터(raw data)를 가져와 분석 및 머신러닝과 같은 다운스트림 사용 사례를 지원하는, 고품질의 일관된 정보를 생성하는 시스템과 프로세스의 개발, 구현 및 유지 관리이다. 데이터 엔지니어링은 보안, 데이터 관리, 데이터 운영, 데이터 아키텍처, 오케스트레이션, 소프트웨어 엔지니어링의 교차점이다. 데이터 엔지니어는 원천 시스템에서 데이터를 가져오는 것부터 시작해 분석 또는 머신러닝과 같은 사용 사례에 데이터를 제공하는 것으로 끝나는 데이터 엔지니어링 수명 주기를 관리한다. 데이터 엔지니어링 수명 주기라는 아이디어를 중심보면 데이터는 생성, 저장, 수집, 변환, 서빙 뿐만 아니라 드러나지 않는 요소인 보안.. 2023. 11. 3.