전체 글6 서버실에 가지 않고도 서버를 원하는 시점으로 복구하다 안녕하세요, 주인장입니다.이전 게시글의 내용과 같이, GPU 서버의 초기 설정을 잘 마쳤는데요.이 설정을 모든 서버에 직접 하는 게 말도 안 돼서 원격으로 파티션을 복사하도록 구성했습니다. 구성을 먼저 살펴보자면,PXE 서버를 하나 둘건데 저는 iVentoy를 사용했습니다.파티션 백업/복구 솔루션으로 rescuezilla를 채택했습니다.Supermicro와 AsrockRack의 메인보드에 존재하는 IPMI(BMC) 기능을 이용해 원격지에서 작업했습니다. iVentoy란?iVentoy is an enhanced version of the PXE server.With iVentoy you can boot and install OS on multiple machines at the same time throu.. 2025. 8. 21. (수정 중) GPU 서버 초기 설정 과정을 기록해봅니다 안녕하세요, 주인장입니다.2학기 개강 전에 모든 GPU서버를 재설정하게 되었는데, 이 과정을 공유해보려 합니다. 우선, 저희는 우분투 데스크톱을 호스트 운영체제로 사용하며 nvidia/cuda 이미지를 입맛에 따라 빌드해 각 도커 컨테이너에 GPU를 할당하여 사용하고 있습니다. 대략적인 과정은 다음과 같습니다.우분투 설치 -> 엔비디아 드라이버 설치 -> 엔비디아 컨테이너 툴킷 설치 -> 컨테이너 실행+ GPU 죽는 문제 해결 (docker-cgroupfs)+ IPMI(BMC) 적용 (호스트 운영체제가 죽더라도 문제 해결 가능)+ BMC에서 화면이 나오지 않는 문제 해결 (nvidia-drm 비활성화) 하나의 서버를 세팅한 후 파티션을 복사해 모든 서버에 동일한 환경을 가지도록 할 생각입니다. (1) 우.. 2025. 8. 15. nvidia 드라이버 설치 후 IPMI에서 화면이 안 나올 때 대처법 sudo sh NVIDIA-Linux-x86_64-575.57.08.run --no-drm --disable-nouveau "--no-drm" 2025. 8. 1. 서버별 아이피 정리 보호되어 있는 글 입니다. 2025. 7. 31. 이전 1 2 다음