Context Navigation

Version 4 (modified by jazz, 17 years ago) (diff)
--

2009-06-06

排解 Hadoop 實驗叢集磁碟空間不足的問題
- [狀況] 當執行使用者的 Map/Reduce? 程式時，DRBL Server 的磁碟空間會使用到 100% 而出現 no space left 的訊息
- [追蹤] 使用 watch -n 1 -d du -sh /var/lib/hadoop 追出 mapreduce 目錄下的 jobcache 計算時會不斷長大。
- [解法] 本來 DRBL Hadoop 只有掛載 Client 硬碟到 /var/lib/hadoop/cache/hadoop/dfs/data，由這個使用案例來看，我們應該要掛載到 /var/lib/hadoop 也就是同時給 DFS 跟 MapReduce 用。
HADOOP-FAQ1 : 使用 ntpdate 更新時間後，Datanode 與 Tasktracker 部分離線。
- 因為 Hadoop 會有 heartbeat 檢查，因此如果跑 ntpdate 後，時間差距太大，會造成系統誤判 Datanode 與 Tasktracker 為 Dead Node。
HADOOP-FAQ2 : 如何取消 Hadoop Namenode 的 Safe mode
- [狀況] Tasktracker 無法正常加入，log 顯示 namenode 處於 safe mode。
- [參考] Re: Safe mode is ON
- [解法] 確認 Datanode 已加入，然後使用指令離開 Safe Mode
```
sudo su -s /bin/sh hadoop -c "hadoop dfsadmin -safemode leave"
```
創用 CC 授權條款一覽