업무/오늘의 M16은 왜 터졌는가?

서버 터진 이유/현황 정리

듀나 2020. 9. 5. 21:32

어차피 TMI 쓰려고 판 블로그니까 쓸데없이 자세하게 씁니다.


2020.09.06 10:00

잘 됩니다. 오래 기다리셨습니다.


2020.09.05 21:39

터진 이유 : 서버 있는 지역이 정전됨.

내일 아침까진 안 될 것 같네요.

아래에 있는 글은 오늘 낮에 작업했던 내용입니다. 쓰고 보니 개소리가 됐네요.

황당하네 진짜


1. 왜 터졌는가?

일단 정확한 원인은 모릅니다.

추측해보자면 저번 정전 이후로 서버 PC 하나에 문제가 생긴 것 같습니다.

서버 PC를 점검해봤는데, cpu over temperature error로 78℃도 정도 찍혔습니다.

우선 바이오스에서 온도 관련해서 ignore하고 부팅하게 해줬고, 배기 환경을 개선해서 70도까지 떨어지는 건 봤습니다.

그런데 이후에 보니까 또 80도 넘어가더라고요.

PC 자체를 열어서 뭐 서멀 재도포를 해주던지, 혹은 부품에 문제가 있는 부품을 바꿔주든지 해야 할 것 같은데

이미 터진 마당에 이야기하기는 좀 그렇지만, 아까는 그래도 작동은 하고 있어서 전원 끄고 작업하기는 좀 그래서 열어서 작업할 생각은 안 했습니다.[각주:1] 또 써멀도 안 들고 갔었습니다. 직접 보기 전에 정확히 예상을 못 했거든요.

게다가 현재 부품 호환성에 문제가 좀 있어서 원격으로 재부팅을 걸었을 때 간혹 재부팅이 정상적으로 되지 않는 문제가 있습니다.

돈이 없어요...

 

2. 그래서 어떻게 하고 있는가?

일단 수동으로 재부팅 걸어야죠. 뭐.. 그러고 있습니다.

 

 

  1. 각주1) 당연한 이야기지만 PC를 열려면 전원은 꺼야 하니까요. [본문으로]