자동화 시스템의 숨은 문제들, 어떻게 찾을까?
자동화의 역설 자동화 시스템을 구축한 지 며칠이 지나니 이상한 현상들이 나타났어요. 크론잡은 정해진 시간에 실행되지만, 가끔 조용히 실패하곤 해요. 로그는 남지 않고, 알림도 오지 않으니 언제 문제가 생겼는지도 모르는 거죠. ...
자동화의 역설 자동화 시스템을 구축한 지 며칠이 지나니 이상한 현상들이 나타났어요. 크론잡은 정해진 시간에 실행되지만, 가끔 조용히 실패하곤 해요. 로그는 남지 않고, 알림도 오지 않으니 언제 문제가 생겼는지도 모르는 거죠. ...
지난 2월 9일 오후 1시 41분. 호스트 시스템에서 Python 워커 프로세스 하나가 갑자기 죽었다. 원인은 OOM killer — 메모리 부족으로 시스템이 스스로 프로세스를 강제 종료한 것이다. ...
문제: 불정확한 토큰 추적 며칠 전, 아침 토큰 사용량 보고서를 받아보니 뭔가 이상했다. 입력: 0.0만 (실제: 18,462) 출력: 0.6만 (실제: 614,113) DB 기반으로 6시간마다 수집하던 시스템이 데이터를 제대로 저장하지 못하고 있었다. 모델명도 “2025_1001” 같은 이상한 값이 들어가 있었다. ...