= 2009-11-17 = * 100 年計畫概算計畫書彙整 == DRBL-BOINC , DRBL-Ganglia , collectd == * 架設 DRBL-BOINC 實驗平台 * 架設 DRBL-Ganglia 實驗平台 * [備註] 由於 /etc/gmond.conf 預設的 mcast_if 是 eth1,而我們的機器是 eth0 接在一起,所以需要手動修改 * 安裝 collectd 來進行本機狀態監控 == Linux == * [源起] 當 DRBL Client 的 NFS 連線異常,造成因無基本檔案系統存在而無法 ssh 登入。然而此時 DRBL Client 仍舊可以正常回應 ping 封包,代表處理 socket 的程序仍存活在記憶體中,是否有一個機制可以緊急進行關機(shutdown)或重開機(reboot),彷彿人在電腦前按下電源按鈕呢??先前一直在找 init 與 shutdown 指令原始碼裡有何蛛絲馬跡可以透過中斷的方式強迫關機,可惜很難追蹤。 * [搜尋關鍵字] force shutdown kernel linux * [搜尋結果] [http://smshaker.wordpress.com/2009/03/02/linux-force-rebootshutdown/ Linux force reboot/shutdown] * 後來發現 jserv 2008年八月就[http://blog.linux.org.tw/~jserv/archives/002060.html 提過]這個作法了 :( * [http://wadefs.blogspot.com/2008/08/documentation-sysrqtxt.html 當硬碟壞到不能關機怎麼辦?] * [http://linuxgazette.net/issue81/vikas.html SysRq: The Process-nuke] * 知識背景追蹤 * 關於 /proc/sysrq-trigger * [http://www.redhat.com/docs/manuals/enterprise/RHEL-4-Manual/en-US/Reference_Guide/s2-proc-sysrq-trigger.html Redhat 手冊的說明 - /proc/sysrq-trigger] * 其實除了 CTRL+ALT+DEL 外,Linux 還可以透過 [http://en.wikipedia.org/wiki/SysRq System Request (Sys Rq) 按鍵] 來做一些特殊除錯工作。這個 Sys Rq 鍵,通常跟 Print Screen 鍵做在一起。 * 要啟用這個功能,首先必須確認核心的 CONFIG_MAGIC_SYSRQ 參數是否有 enable。 * [http://en.wikipedia.org/wiki/Magic_SysRq_key 維基百科除了說明 SYSRQ 可以做哪些事情]外,還介紹了[http://julien.danjou.info/sysrqd/ sysrqd]這個軟體,讓管理者可以遠端執行 SYSRQ 的指令。PS.[http://packages.debian.org/sysrqd sysrqd 也有 debian 套件]!! * 關於 /proc/sys/kernel/sysrq * [http://www.redhat.com/docs/manuals/enterprise/RHEL-4-Manual/en-US/Reference_Guide/s3-proc-sys-kernel.html Redhat 手冊的說明 - /proc/sys/kernel/ 底下的檔案意涵] * [http://lxr.linux.no/#linux+v2.6.31/Documentation/sysrq.txt Linux 核心關於 SysRq 的說明] *