<aside> 💡

요약

객실 요금 로그 통계 작업은, 서버별로 분산된 로그 파일을 수작업으로 추출하고 통합해야 해서 하루치 데이터만도 3~4시간 이상 걸리는 반복적이고 비효율적인 작업이었습니다.

추출한 csv 파일을 하나로 합치고, 중복(호텔코드+체크인+체크아웃)을 sum으로 집계하는 과정이 많아 직접 처리하기 어렵고, 데이터량이 많은 제휴사에선 수작업이 불가능했습니다.

이를 개선하기 위해 sh 스크립트로 1차 자동 추출, 파이썬(pandas) 스크립트로 csv/xlsx 파일 자동 머지 및 통계 집계를 구현해, 작업시간과 실수 위험을 획기적으로 줄였습니다.

폴더에 파일만 넣으면 자동으로 엑셀 시트별 분할·total 시트 집계까지 가능하게 하여, 누구나 반복 작업을 신속하게 재현할 수 있는 데이터 자동화 체계를 구축했습니다.

</aside>


개요



개선 목표



작업 상세 ( 스크립트/ 자동화 흐름 )


1. 로그 파일 추출 (서버별)

2. 머지 및 통계 집계 (python 자동화)