佳木斯湛栽影视文化发展公司

主頁 > 知識庫 > Linux下如何尋找相同文件的方法

Linux下如何尋找相同文件的方法

熱門標簽:網(wǎng)站建設(shè) 阿里云 使用U盤裝系統(tǒng) 智能手機 百度競價點擊價格的計算公式 檢查注冊表項 硅谷的囚徒呼叫中心 美圖手機

隨著電腦的使用,系統(tǒng)里將產(chǎn)生很多垃圾,最典型的就是同一份文件被保存到了不同的位置,這樣導(dǎo)致的結(jié)果就是磁盤空間被大量占用,系統(tǒng)運行越來越慢。

所以如果你的電腦空間告急的話,可以試著去刪除這樣的文件,釋放一些空間。在 Linux 下,我們可以通過識別文件的 inode 值來找出系統(tǒng)中的相同文件。

inode 是一個數(shù)據(jù)結(jié)構(gòu),記錄了文件所有信息,除了文件名和文件內(nèi)容。如果兩個或多個文件具有相同的 inode 值,即使它們的文件名不一樣,位置不一樣,它們的內(nèi)容、所有者、權(quán)限其實都是一樣的,我們可以將其視有相同文件。

這類型的文件其實就是所謂的「硬鏈接」。硬鏈接具有相同的 inode 值,但文件名不一樣。而軟鏈接其實就是快捷方式,它指向目標文件,但有著自己的 inode 值。

$ ls -l my*
-rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 myfile
lrwxrwxrwx 1 liangxu liangxu   6 Apr 15 11:18 myref -> myfile
-rw-r--r-- 4 liangxu liangxu  228 Apr 12 19:37 mytwin

我們無法直接知道同一目錄下有哪些文件是有相同的 inode 值,但要識別起來也不難。其實我們只要使用 ls -i 命令,再以 inode 值進行排序,就可以直接找到這些文件。

$ ls -i | sort -n | more
 ...
 788000 myfile  <==
 788000 mytwin  <==
 801865 Name_Labels.pdf
 786692 never leave home angry
 920242 NFCU_Docs
 800247 nmap-notes

在這個結(jié)果的第一列里,就是對應(yīng)的 inode 值。所以從這個結(jié)果里我們一眼就可以看出來,哪些文件具有相同 inode 值。

如果你只是想找到一個文件的對應(yīng)硬鏈接文件,我們可以使用 find 命令,再加個 -samefile 選項即可快速找到。

$ find . -samefile myfile
./myfile
./save/mycopy
./mytwin

這些文件都是有相同的 inode 值,不信的話可以再使用 ls 命令來查看更多信息:

$ find . -samefile myfile -ls
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./myfile
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./save/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu   228 Apr 12 19:37 ./mytwin

我們可以看到,除了文件名之外,這幾個文件名的信息完全一樣。細心的朋友可能會注意到,在第2列(硬連接數(shù))是4,而實際上我們找出來的文件只有3個,這說明還有一個文件與他們共享 inode 值,只是我們通過這條命令沒有找出來而已。

作為一個懶人,每次敲命令多麻煩,直接上腳本找出目錄下的相同文件!

#!/bin/bash

# seaches for files sharing inodes

prev=""

# list files by inode
ls -i | sort -n > /tmp/$0

# search through file for duplicate inode #s
while read line
do
  inode=`echo $line | awk '{print $1}'`
  if [ "$inode" == "$prev" ]; then
    grep $inode /tmp/$0
  fi
  prev=$inode
done < /tmp/$0

# clean up
rm /tmp/$0

運行結(jié)果:

$ ./findHardLinks
 788000 myfile
 788000 mytwin

當然了,你還可以使用 find 命令,根據(jù) inode 值,找到系統(tǒng)里所有相同文件。

$ find / -inum 788000 -ls 2> /dev/null
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /tmp/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/myfile
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/save/mycopy
 788000  4 -rw-r--r--  4 liangxu  liangxu  228 Apr 12 19:37 /home/liangxu/mytwin

在這條命令里,我們將錯誤提示重定向到 /dev/null 這個特殊文件里,這樣在搜索一些我們沒有權(quán)限訪問的路徑時,不會滿屏的 permission denied 。

到此這篇關(guān)于Linux下如何尋找相同文件的方法的文章就介紹到這了,更多相關(guān)Linux 尋找相同文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

標簽:懷化 通遼 湖北 湘潭 煙臺 山南 黃山 賀州

巨人網(wǎng)絡(luò)通訊聲明:本文標題《Linux下如何尋找相同文件的方法》,本文關(guān)鍵詞  ;如發(fā)現(xiàn)本文內(nèi)容存在版權(quán)問題,煩請?zhí)峁┫嚓P(guān)信息告之我們,我們將及時溝通與處理。本站內(nèi)容系統(tǒng)采集于網(wǎng)絡(luò),涉及言論、版權(quán)與本站無關(guān)。
  • 相關(guān)文章
  • 收縮
    • 微信客服
    • 微信二維碼
    • 電話咨詢

    • 400-1100-266
    建阳市| 霍林郭勒市| 耿马| 高邮市| 望江县| 淮阳县| 保靖县| 邹城市| 临朐县| 长丰县| 梓潼县| 尖扎县| 通城县| 虎林市| 西乡县| 施甸县| 洛扎县| 庆云县| 平山县| 南京市| 轮台县| 翁牛特旗| 精河县| 泗洪县| 弋阳县| 进贤县| 潜山县| 新余市| 卓资县| 阿勒泰市| 鄂托克旗| 汾西县| 阳曲县| 舟曲县| 武宣县| 垫江县| 云和县| 中西区| 沈阳市| 嘉荫县| 温泉县|