主頁 > 知識庫 > hadoop遷移數(shù)據(jù)應(yīng)用實例詳解

hadoop遷移數(shù)據(jù)應(yīng)用實例詳解

項目開發(fā)中hadoop一直裝在虛擬機(jī)上，最近要遷移到服務(wù)器上。記錄下遷移過程。

一、為虛擬機(jī)添加一塊新的硬盤

虛擬機(jī)的初始硬盤只有30G，容不開要導(dǎo)出的數(shù)據(jù)。兩種方式，一是給虛擬機(jī)擴(kuò)容；二是為虛擬機(jī)添加一塊新的硬盤。這里采取第二種方式。

1、添加虛擬硬盤

至此，添加硬盤成功。

2、將硬盤分區(qū)

要使用一塊新的硬盤，需要先將硬盤分區(qū)，然后掛在文件系統(tǒng)上才能使用。

這里普及一下linux的文件系統(tǒng)與硬盤以及分區(qū)的關(guān)系。按照一個“由硬到軟”的順序來講，首先是硬盤，是物理的；我們要使用這個物理硬盤，需要將物理硬盤分成一個一個的分區(qū)；而我們在使用操作系統(tǒng)時，則通過文件系統(tǒng)來操作文件。文件系統(tǒng)這個“軟件“是通過分區(qū)與硬盤這個“硬件”進(jìn)行聯(lián)系的：硬盤分成區(qū)后，以分區(qū)的形式掛在文件系統(tǒng)上。

舉例比較windows與linux文件系統(tǒng)的區(qū)別：

對于windows來講，比如我們的電腦上只安裝了一塊硬盤，這個硬盤分了四個區(qū)，對應(yīng)我們文件系統(tǒng)中的CDEF盤。即四個分區(qū)在我們使用者看來是平級的。這時如果添加了一個

對于linux來講，硬盤也是以分區(qū)的形式掛載在文件系統(tǒng)上。這點(diǎn)與windows一致。不同的是，windows有多個文件系統(tǒng)樹（C：D：E：F：），而linux只有一個文件系統(tǒng)樹，也就是我們看到的，所有的目錄以及文件都是在根目錄 / 下的。那么linux是怎么掛的呢？linux會將不同的分區(qū)掛在不同的目錄下。

如圖：

圖中，文件系統(tǒng)其實就是我們上邊講的分區(qū)，這些文件系統(tǒng)（分區(qū)）共同組成了我們linux整個的文件系統(tǒng)。這里注意，其實文件系統(tǒng)與分區(qū)是統(tǒng)一的，可以認(rèn)為分區(qū)是文件系統(tǒng)的載體，我們上邊講它們兩者的關(guān)系，只是為了進(jìn)一步幫助理解。那么既然分區(qū)是掛在linux的基于根目錄的這棵“樹”上的，我們就將分區(qū)掛的這個目錄稱為掛載點(diǎn)。如上。

下邊我們來具體講解一下關(guān)于將硬盤分區(qū)的命令：

a、使用：fdisk -l 命令查看硬盤及分區(qū)信息，如圖：

圖中，使用矩形圍起來的是硬盤，一般硬盤會按照sda、sdb、sdc的順序依次添加。下邊兩塊硬盤暫時不要考慮。

使用橢圓圈起來的是分區(qū)，如硬盤sda有三個分區(qū)，分別是sda1、sda2、sda3。

可以看到箭頭指向的硬盤sdc沒有分區(qū)，這意味著這塊硬盤尚未被使用，這就是我們新添加的硬盤。

b、通過 fdisk /dev/sdc 對新硬盤進(jìn)行分區(qū)

輸入m可以打印我們的操作菜單，注意上邊紅線圈出的命令，n代表新建一個分區(qū)，p代表打印當(dāng)前硬盤的分區(qū)表，w代表向硬盤寫入分區(qū)表。接下來我們依次執(zhí)行。如圖：

輸入n，新建一個分區(qū)，兩個選項，p代表主分區(qū)，e代表擴(kuò)展分區(qū)，選擇p主分區(qū)；第二次輸入p是為了打印分區(qū)表，可以看到分區(qū)sdc1創(chuàng)建成功。創(chuàng)建過程中的分區(qū)好，起始扇區(qū)，last扇區(qū)使用默認(rèn)值直接回車即可。最后輸入w，寫入分區(qū)。

c、使用 mkfs -t ext4 /dev/sdc1 將新分區(qū)格式化成ext4的格式

如圖：

d、通過 mount /dev/sdc1 /disk5 將新的分區(qū)sdc1掛載到目錄disk5下邊

如圖：

最后，我們通過df -lh /disk5 命令查看目錄disk5，發(fā)現(xiàn)其確實是新的分區(qū)sdc1，掛在成功。如此，便可正常使用新加的硬盤了。

小結(jié)：用到了 fdisk df mkfs mount 等幾個命令，注意復(fù)習(xí)。

二、hadoop的命令的使用

1、首先需要執(zhí)行命令使hadoop命令能夠被識別。

export PATH=$PATH:/home/hadoop/hadoop-2.5.2/bin

2、hadoop的文件系統(tǒng)的命令與linux的命令十分一致，下邊舉例說明：

hadoop fs -ls / 表示列出根目錄下的所有文件（夾）
hadoop fs -put readme.txt /user/hadoop/test/ 表示將readme.txt文件上傳到hdfs的/user/hadoop/test/目錄下
hadoop fs -get / /hadoop_data 表示將hdfs文件系統(tǒng)根目錄/下的所有文件（夾）導(dǎo)出到本地的/hadoop_data目錄下
hadoop fs -rm / 表示刪除hdfs文件系統(tǒng)中的所有文件（夾）

總結(jié)

以上所述是小編給大家介紹的hadoop遷移數(shù)據(jù)應(yīng)用實例詳解，希望對大家有所幫助，如果大家有任何疑問歡迎給我留言，小編會及時回復(fù)大家的！

標(biāo)簽：河南長治樂山紅河沈陽新疆滄州上海

巨人網(wǎng)絡(luò)通訊聲明：本文標(biāo)題《hadoop遷移數(shù)據(jù)應(yīng)用實例詳解》，本文關(guān)鍵詞；如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題，煩請?zhí)峁┫嚓P(guān)信息告之我們，我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò)，涉及言論、版權(quán)與本站無關(guān)。