<aside> 💡
요약
객실 요금 로그 통계 작업은, 서버별로 분산된 로그 파일을 수작업으로 추출하고 통합해야 해서 하루치 데이터만도 3~4시간 이상 걸리는 반복적이고 비효율적인 작업이었습니다.
추출한 csv 파일을 하나로 합치고, 중복(호텔코드+체크인+체크아웃)을 sum으로 집계하는 과정이 많아 직접 처리하기 어렵고, 데이터량이 많은 제휴사에선 수작업이 불가능했습니다.
이를 개선하기 위해 sh 스크립트로 1차 자동 추출, 파이썬(pandas) 스크립트로 csv/xlsx 파일 자동 머지 및 통계 집계를 구현해, 작업시간과 실수 위험을 획기적으로 줄였습니다.
폴더에 파일만 넣으면 자동으로 엑셀 시트별 분할·total 시트 집계까지 가능하게 하여, 누구나 반복 작업을 신속하게 재현할 수 있는 데이터 자동화 체계를 구축했습니다.
</aside>
사업부 요청으로 “특정 제휴사, 특정일의 객실 요금 통계”가 필요함 ( 시설 / 체크인 / 체크아웃 기준 )
요금 로그는 각 서버(18대)별로 분산되어 있음 신규 제휴사 유입으로 인해 9대에서 18대로 추가 증설한 상태
서버별로 직접 로그를 추출(grep → csv) 후 통합해야 하며, 수작업으로 1일치도 3~4시간, 2일치면 추가 4시간 이상 소요됨
→ gpt로 자동화 지원 받아도 3시간 이상