linux文本處理命令是一類(lèi)對文件進(jìn)行操作的命令,通過(guò)使用文本處理命令,可以輕松的對文件進(jìn)行排序,拆分,合并等操作,熟練掌握文本處理命令,在生物信息文本處理中,有十分重要的意義。
一、cat?查看文件內容命令
以下為最常用的幾個(gè)命令實(shí)例:

注意事項:
遇到大文件的時(shí)候,不要直接cat,因為cat會(huì )一直把所有內容打印到屏幕上,造成長(cháng)時(shí)間處于打印狀態(tài),如遇到這種情況,連續不間斷的敲擊ctrl+c組合鍵退出打印狀態(tài)
相關(guān)衍生命令:
cat還有兩個(gè)常用的相關(guān)命令:
1.zcat ?查看壓縮文件
2.tac ?從結尾往上看內容
二、sort?排序命令
對數據的某一列按照文本,數字等排序方法進(jìn)行排序,也可以進(jìn)行字符內排序,以下為最常用的幾個(gè)命令實(shí)例

三.uniq?去除重復命令
對相同的行去重復,統計重復,保留重復等,還可指定某一列做為去重復關(guān)鍵字去重復,以下為最常用的幾個(gè)命令實(shí)例
注意事項:
uniq需要配合sort進(jìn)行使用,把重復的內容排序到一起,以下為最常用的幾個(gè)命令實(shí)例
四.wc?統計命令
統計指定文件中的字節數、字數、行數,并將統計結果顯示輸出,以下為最常用的幾個(gè)命令實(shí)例
五.grep/egrep命令
grep為過(guò)濾命令,一般情況下支持基本正則表達式,可以通過(guò)參數-E支持擴展正則表達式,常用命令如下:
grep一般情況下支持基本正則表達式,可以通過(guò)參數-E支持擴展正則表達式,另外grep單獨提供了一個(gè)擴展命令叫做egrep用來(lái)支持擴展正則表達式,這條命令和grep -E等價(jià)。雖然一般情況下,基本正則表達式就夠用了,以下為最常用的幾個(gè)命令
六.sed命令
sed是一個(gè)強大的按行處理的命令,常用的命令如下:
七.awk命令
是一個(gè)最強大的文本分析工具,以下列常用文本處理的寫(xiě)法:
八.cut命令
cut命令命令從文件的列剪切字節、字符、域,并將這些字節、字符,域,輸出出來(lái),下面為幾個(gè)常見(jiàn)的用法:
九.split命令
split命令可以按照行或者按照字節分割文件,以下列常用文本處理的寫(xiě)法:
十.paste命令
Paste命令可按列合并命令,可以很輕松的將兩個(gè)文件按列合并,下面是常見(jiàn)的舉例:?
十一.xargs
xargs用作替換工具,讀取輸入數據重新格式化后輸出。Xargs命令常跟管道連用,處理管道中的數據流:
?
十二.comm
comm命令比較兩個(gè)文件的相同和不同,下面為常用的命令舉例:
注意事項:兩個(gè)比較的文件需要排序后進(jìn)行
好了linux常用命令就介紹到這里,按照這些實(shí)例好好練習,加上自己的融會(huì )貫通,相信你很快就會(huì )成為快速文本處理的高手