업무/오늘의 M16은 왜 터졌는가?
-
0908 왜 터졌는가업무/오늘의 M16은 왜 터졌는가? 2020. 9. 9. 03:32
9월 8일자 부검입니다. 한 오후 9~10시쯤 잤는데, 새벽에 자다 깨니 대충 살면서 휴대폰으로 받을 수 있는 알림이란 알림은 다 받았습니다. 1. 언제 터진 시점은 9월 8일 23:23 경입니다. 복구 시점은 9월 9일 01:25 경입니다. 2. 왜 간단하게 말하면, 서버 노후화로 인한 발열로 발생한 서버 PC CPU 스로틀링이 원인입니다. 어디서 비슷한 내용을 본 것 같다고요? 예.. 저번에 터질 때 이미 이렇게 예상했습니다. 여러분들이 서버가 느리다고 했던 오후 11시 5분보다도 3분 전인 11시 2분에 개발자가 쓰로틀링 관련으로 카톡을 해뒀습니다. 예상은 했는데 하드웨어 문제라 못 잡은 것 같습니다. 작동 중인 서버를 끌 수도 없고. 이야기했다시피 돈 들어가는 문제라 생각은 좀 해봐야겠네요. 돈 ..
-
서버 터진 이유/현황 정리업무/오늘의 M16은 왜 터졌는가? 2020. 9. 5. 21:32
어차피 TMI 쓰려고 판 블로그니까 쓸데없이 자세하게 씁니다. 2020.09.06 10:00 잘 됩니다. 오래 기다리셨습니다. 2020.09.05 21:39 터진 이유 : 서버 있는 지역이 정전됨. 내일 아침까진 안 될 것 같네요. 아래에 있는 글은 오늘 낮에 작업했던 내용입니다. 쓰고 보니 개소리가 됐네요. 황당하네 진짜 1. 왜 터졌는가? 일단 정확한 원인은 모릅니다. 추측해보자면 저번 정전 이후로 서버 PC 하나에 문제가 생긴 것 같습니다. 서버 PC를 점검해봤는데, cpu over temperature error로 78℃도 정도 찍혔습니다. 우선 바이오스에서 온도 관련해서 ignore하고 부팅하게 해줬고, 배기 환경을 개선해서 70도까지 떨어지는 건 봤습니다. 그런데 이후에 보니까 또 80도 넘어..