Version 4 (modified by jazz, 15 years ago) (diff) |
---|
2009-06-06
- 排解 Hadoop 實驗叢集磁碟空間不足的問題
- [狀況] 當執行使用者的 Map/Reduce? 程式時,DRBL Server 的磁碟空間會使用到 100% 而出現 no space left 的訊息
- [追蹤] 使用 watch -n 1 -d du -sh /var/lib/hadoop 追出 mapreduce 目錄下的 jobcache 計算時會不斷長大。
- [解法] 本來 DRBL Hadoop 只有掛載 Client 硬碟到 /var/lib/hadoop/cache/hadoop/dfs/data,由這個使用案例來看,我們應該要掛載到 /var/lib/hadoop 也就是同時給 DFS 跟 MapReduce 用。
- HADOOP-FAQ1 : 使用 ntpdate 更新時間後,Datanode 與 Tasktracker 部分離線。
- 因為 Hadoop 會有 heartbeat 檢查,因此如果跑 ntpdate 後,時間差距太大,會造成系統誤判 Datanode 與 Tasktracker 為 Dead Node。
- HADOOP-FAQ2 : 如何取消 Hadoop Namenode 的 Safe mode
- [狀況] Tasktracker 無法正常加入,log 顯示 namenode 處於 safe mode。
- [參考] Re: Safe mode is ON
- [解法] 確認 Datanode 已加入,然後使用指令離開 Safe Mode
sudo su -s /bin/sh hadoop -c "hadoop dfsadmin -safemode leave"
- 創用 CC 授權條款一覽