精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Python進行文件比對簡析

sally100 ? 來源:數字ICer ? 2023-03-21 17:24 ? 次閱讀

PythonIC中的應用,主要處理的對象以文本為主,但在某些的情況下,文本文件非常巨大,比如上G的文件。

這個時候,利用gvimdiff,tkdiff對文件的比對是比較慢甚至卡的,Python有很強大的數據處理能力,這里使用zip命令可以非常高效的進行文件比對。

下面腳本參考:

用法:./diff.py test1.log test2.log

./diff.pytest1.logtest2.log

[NOTE]:Found(diff/total):564/5664differentlines
[NOTE]:Fileisdifferent
[NOTE]:Alldifferentlinesaresavedinfile:diffout.rpt

不同行內容輸出到diffout.rpt文件中;

#!/tools/python-3.6.12/bin/python3.6
#-*-coding:UTF-8-*-
importos
importsys

iflen(sys.argv)>1:
file1=sys.argv[1]
file2=sys.argv[2]
else:
print("[ERROR]======Pleaseentertwofile_path")
print("[Usage]:Pythonscript.py")
sys.exit()

defcompare_files(file1,file2):
total_lines=0
different_lines=0
withopen(file1,'r')asf1,open(file2,'r')asf2,open('diffout.rpt','w')asf_out:
#逐行比較兩個文件
fori,(line1,line2)inenumerate(zip(f1,f2)):
ifline1!=line2:
f_out.write('row'+str(i+1)+'isdifferent:
')
f_out.write('	file1:'+line1.rstrip()+'
')
f_out.write('	file2:'+line2.rstrip()+'
')
different_lines+=1
total_lines+=1
iftotal_lines==0:
print('Bothfilesareempty')
ifdifferent_lines==0:
print('Fileissame')
else:
print('[NOTE]:Found(diff/total):{}/{}differentlines'.format(different_lines,total_lines))
print('[NOTE]:Fileisdifferent')
print('[NOTE]:Alldifferentlinesaresavedinfile:diffout.rpt')

compare_files(file1,file2)

其中簡單說明兩個函數:enumerate()和zip(f1, f2)

enumerate() 是 Python 內置函數,它接受一個可迭代對象(如列表、元組、字符串等)作為輸入,返回一個枚舉對象。

這個枚舉對象包含每個元素的索引和值,可以用來遍歷序列時獲取當前元素的索引。

以下是一個使用 enumerate() 函數的示例:

fruits=['apple','banana','cherry']

fori,fruitinenumerate(fruits):
print(i,fruit)

在上面的代碼中,enumerate() 函數將 fruits 列表轉換為一個枚舉對象,遍歷該對象時,每個元素會被拆分成兩部分,一部分是索引,一部分是值。

輸出結果:

0apple
1banana
2cherry

在循環體內,我們可以使用 i 變量來訪問當前元素的索引,使用 fruit 變量來訪問當前元素的值。

zip(f1, f2) 是將兩個可迭代對象 f1 和 f2 中的對應元素一一配對,生成一個新的迭代器;

在比較文件的過程中,zip() 函數可以用來同時遍歷兩個文件對象 f1 和 f2,逐行比較它們的內容。

這里再額外提一個利用difflib 模塊進行文件比對

使用 difflib 模塊進行文件比對可以得到更詳細的文件差異信息。difflib 模塊提供了多種比對算法和函數,可以用來比較文本文件、代碼文件等;

使用 difflib.HtmlDiff() 類來生成差異信息的 HTML 格式。

下面是一個示例代碼,它比對兩個文件并將差異信息以 HTML 格式輸出到文件difflib.html 中

#!/tools/python-3.6.12/bin/python3.6
#-*-coding:UTF-8-*-

importos
importsys
importdifflib

iflen(sys.argv)>1:
file1=sys.argv[1]
file2=sys.argv[2]
else:
print("[ERROR]======Pleaseentertwofile_path")
print("[Usage]:Pythonscript.py")
sys.exit()

defdiff_files(file1,file2,output_file):
#讀取兩個文件的內容
withopen(file1,'r')asf1,open(file2,'r')asf2:
text1=f1.read()
text2=f2.read()

#生成差異信息的HTML格式
d=difflib.HtmlDiff()
html=d.make_file(text1.splitlines(),text2.splitlines())

#將HTML內容寫入文件
withopen(output_file,'w')asf:
f.write(html)
print("
Diffcompleted.")

if__name__=='__main__':
diff_files(file1,file2,'difflib.html')

上面的代碼中,使用 difflib.HtmlDiff() 類的 make_file() 方法生成差異信息的 HTML 格式。

注意要使用 splitlines() 方法將文本轉換為行列表。

00079cec-bc23-11ed-bfe3-dac502259ad0.png

生成的 HTML 文件中,差異信息會以表格形式呈現,每一行的左側顯示行號,右側顯示該行的內容。

這種格式的輸出相對于純文本格式的輸出更容易閱讀和理解,特別是在需要比對較長文本時,能夠提高比對效率和結果的準確性。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • HTML
    +關注

    關注

    0

    文章

    277

    瀏覽量

    34497
  • python
    +關注

    關注

    56

    文章

    4782

    瀏覽量

    84460

原文標題:Python進行文件比對

文章出處:【微信號:數字ICer,微信公眾號:數字ICer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏

    評論

    相關推薦

    python文件如何打包成exe可執行文件

    python文件打包成exe可執行文件前言  也許我們不一定是專業的程序員,但是我們仍然可以通過代碼提高我們的效率,盡量少加班,多陪陪媳婦。再不行,讓代碼替我們干著重復的工作,我們有節省出來的時間
    發表于 07-06 06:34

    如何使用三種方式進行文件的創建

    ,使用文本編輯器進行創建,使用重定向符號進行創建,接下來就演示如何使用這三種方式進行文件的創建。使用touch命令進行文件創建touch命令最初的作用是對
    發表于 12-15 08:42

    K510跑python的opencv可行嗎?打包為linux可執行文件能跑嗎?

    想了解一下K510跑python的opencv可行嗎?打包為linux可執行文件能跑嗎?
    發表于 09-14 09:01

    EPON技術

    EPON技術 EPON是一個新技術,用于保證提供一個高品質與高帶寬利用率的應用。   EPON在日本、韓國、中國大陸、中國臺灣及其它以以太網絡為基礎的地區都
    發表于 01-22 10:43 ?855次閱讀

    Perl編程之進行文件操作

    到現在為止,我們介紹的P e r l程序都是獨立的程序。除了向用戶提供消息和接收來自鍵盤 的輸入信息外,它們無法與外界進行通信。這種狀況將要改變。 P e r l是一種能夠進行文件輸入
    發表于 03-26 15:59 ?0次下載

    設計仿真實例的運行文件及C程序

    設計仿真實例的運行文件及C程序
    發表于 03-04 14:01 ?27次下載

    鼠標HID例程(中)

    鼠標 HID 例程 緊接《鼠標 HID 例程(上)》一文,繼續向大家介紹鼠 標 HID 例程的未完的內容。
    發表于 07-26 15:18 ?0次下載

    STC89C52單片機的C語言進行文件分裂的工程文件免費下載

    本文檔的主要內容詳細介紹的是STC89C52單片機的C語言進行文件分裂的工程文件免費下載。
    發表于 10-14 08:00 ?2次下載
    STC89C52單片機的C語言<b class='flag-5'>進行文件</b>分裂的工程<b class='flag-5'>文件</b>免費下載

    Linux操作環境:diff實現文本比對方法

    我們在寫代碼的過程中,免不了會對代碼進行一些修修改改。但經常會出現改著改著,就不知道改完后與源文件的差異是怎樣的。這里,我們就需要一個文本比對工具來進行文
    的頭像 發表于 09-16 16:12 ?2812次閱讀
    Linux操作環境:diff實現文本<b class='flag-5'>比對</b>方法

    Python進行配置文件的教程免費下載

    本文檔的主要內容詳細介紹的是Python進行配置文件的教程免費下載。
    發表于 09-30 16:41 ?6次下載
    <b class='flag-5'>Python</b><b class='flag-5'>進行</b>配置<b class='flag-5'>文件</b>的教程免費下載

    常見Python習題詳解

    Python程序有兩種運行方式:交互式和文件式。 交互式利用Python解釋器即時響應用戶輸入的代碼,給出輸出結果。 文件式將Pytho
    發表于 07-11 09:43 ?1次下載

    Python】如何將Python腳本打包成exe可執行文件

    Python實用技巧】如何將Python腳本打包成exe可執行文件?
    的頭像 發表于 08-18 12:40 ?1.8w次閱讀
    【<b class='flag-5'>Python</b>】如何將<b class='flag-5'>Python</b>腳本打包成exe可執<b class='flag-5'>行文件</b>

    5G AAU 功放控制和監測模塊

    5G AAU 功放控制和監測模塊
    發表于 10-28 12:00 ?2次下載
    5G AAU 功放控制和監測模塊<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    AFE8092幀同步特性

    AFE8092幀同步特性
    的頭像 發表于 08-24 13:37 ?628次閱讀
    AFE8092幀同步特性<b class='flag-5'>簡</b><b class='flag-5'>析</b>

    如何使用 Llama 3 進行文本生成

    torch 使用Hugging Face的pipeline進行文本生成。 python復制代碼 from tr
    的頭像 發表于 10-27 14:21 ?216次閱讀