= 2009-06-06 = * 排解 Hadoop 實驗叢集磁碟空間不足的問題 * [狀況] 當執行使用者的 Map/Reduce 程式時,DRBL Server 的磁碟空間會使用到 100% 而出現 no space left 的訊息 * [追蹤] 使用 watch -n 1 -d du -sh /var/lib/hadoop 追出 mapreduce 目錄下的 jobcache 計算時會不斷長大。 * [解法] 本來 DRBL Hadoop 只有掛載 Client 硬碟到 /var/lib/hadoop/cache/hadoop/dfs/data,由這個使用案例來看,我們應該要掛載到 /var/lib/hadoop 也就是同時給 DFS 跟 MapReduce 用。 * HADOOP-FAQ1 : 使用 ntpdate 更新時間後,Datanode 與 Tasktracker 部分離線。 * 因為 Hadoop 會有 heartbeat 檢查,因此如果跑 ntpdate 後,時間差距太大,會造成系統誤判 Datanode 與 Tasktracker 為 Dead Node。 * HADOOP-FAQ2 : 如何取消 Hadoop Namenode 的 Safe mode * [狀況] Tasktracker 無法正常加入,log 顯示 namenode 處於 safe mode。 * [參考] [http://www.mail-archive.com/hadoop-user@lucene.apache.org/msg01486.html Re: Safe mode is ON] * [解法] 確認 Datanode 已加入,然後使用指令離開 Safe Mode {{{ sudo su -s /bin/sh hadoop -c "hadoop dfsadmin -safemode leave" }}} * [http://creativecommons.org.tw/static/license 創用 CC 授權條款一覽]