Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |
Tags
- IntelliJ
- MySQL
- kotlin spring
- Elasticsearch
- 정보처리기사실기 기출문제
- 정보처리기사 실기
- kotlin
- aws
- 공부
- 티스토리챌린지
- CKA
- minikube
- Linux
- mysql 튜닝
- Pinpoint
- APM
- AWS EKS
- Java
- Spring
- 기록으로 실력을 쌓자
- PETERICA
- 정보처리기사 실기 기출문제
- kotlin querydsl
- kotlin coroutine
- 코틀린 코루틴의 정석
- AI
- Kubernetes
- CloudWatch
- 오블완
- CKA 기출문제
Archives
- Today
- Total
피터의 개발이야기
[AWS Athena] AWS Athena alb log 분석용 테이블 생성문 본문
반응형
ㅁ 들어가며
트래픽 지연이 발생하면 해당 대상을 찾아야하는 경우가 발생합니다. 이럴 경우 alb의 log를 분석하여 그 대상을 찾을 경우 로그 내용을 테이블로 생성하여 SQL으로 분석을 한다면 쉽게 그 대상을 찾을 수 있을 것입니다. AWSAthena는 S3에 저장된 log를 정규화 패턴으로 데이터화 하고 SQL을 통해 조회할 수 있었습니다. Athena를 이용해 테이블 생성 쿼리를 남겨 봅니다.
ㅁ Athena란?
Amazon Athena는 표준 SQL을 사용하여 Amazon S3(Amazon Simple Storage Service)에 있는 데이터를 직접 간편하게 분석할 수 있는 대화형 쿼리 서비스입니다. AWS Management Console에서 몇 가지 작업을 수행하면 Athena에서 Amazon S3에 저장된 데이터를 지정하고 표준 SQL을 사용하여 임시 쿼리를 실행하여 몇 초 안에 결과를 얻을 수 있습니다.
ㅁ alb log 분석용 테이블 생성
ㅇ 운영에서 사용해던 alb log 분석 테이블 생성 쿼리를 남겨보았습니다.
ㅇ Athena의 데이터베이스 생성 방법은 AWS Athena 시작하기에서 확인하실 수 있습니다.
CREATE EXTERNAL TABLE IF NOT EXISTS int_alb_logs_new (
type string,
time string,
elb string,
client_ip string,
client_port int,
target_ip string,
target_port int,
request_processing_time double,
target_processing_time double,
response_processing_time double,
elb_status_code string,
target_status_code string,
received_bytes bigint,
sent_bytes bigint,
request_verb string,
request_url string,
request_proto string,
user_agent string,
ssl_cipher string,
ssl_protocol string,
target_group_arn string,
trace_id string,
domain_name string,
chosen_cert_arn string,
matched_rule_priority string,
request_creation_time string,
actions_executed string,
redirect_url string,
lambda_error_reason string,
target_port_list string,
target_status_code_list string,
classification string,
classification_reason string
)
ROW FORMAT SERDE 'org.apache.hadoop.hive.serde2.RegexSerDe'
WITH SERDEPROPERTIES (
'serialization.format' = '1',
'input.regex' =
'([^ ]*) ([^ ]*) ([^ ]*) ([^ ]*):([0-9]*) ([^ ]*)[:-]([0-9]*) ([-.0-9]*) ([-.0-9]*) ([-.0-9]*) (|[-0-9]*) (-|[-0-9]*) ([-0-9]*) ([-0-9]*) \"([^ ]*) ([^ ]*) (- |[^ ]*)\" \"([^\"]*)\" ([A-Z0-9-]+) ([A-Za-z0-9.-]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\" \"([^\"]*)\" ([-.0-9]*) ([^ ]*) \"([^\"]*)\" \"([^\"]*)\" \"([^ ]*)\" \"([^\s]+?)\" \"([^\s]+)\" \"([^ ]*)\" \"([^ ]*)\"')
LOCATION 's3://prd-peterica-alb/int-alb/AWSLogs/123456789123/elasticloadbalancing/ap-northeast-2/';
ㅁ 함께 보면 좋은 사이트
ㅇ Amazon Athena를 사용하여 S3에서 데이터 분석
반응형
'AWS' 카테고리의 다른 글
[AWS] CloudWatch와 CloudTrail의 차이점 (0) | 2023.08.02 |
---|---|
[AWS AutoScaling] 시작 구성 수정방법 (0) | 2022.12.19 |
[AWS AutoScaling] 시작 구성과 시작 템플릿의 차이점 (0) | 2022.12.19 |
[AWS EC2 AutoScaling] 시작구성 생성, AutoScalingGroup 생성 (0) | 2022.12.19 |
[AWS VPN] Amazon VPC의 CIDR 블록 IP 확장방법, AWS IP증설 (1) | 2022.12.13 |
Comments