精品国产人成在线_亚洲高清无码在线观看_国产在线视频国产永久2021_国产AV综合第一页一个的一区免费影院黑人_最近中文字幕MV高清在线视频

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發帖/加入社區
會員中心
創作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Pandas:Python中最好的數據分析工具

科技綠洲 ? 來源:Python實用寶典 ? 作者:Python實用寶典 ? 2023-10-31 10:47 ? 次閱讀

Pandas絕對是Python中最好的數據分析工具,不接受反駁。

本文將展示如何美化 Pandas DataFrame 中的數字,并使用一些更高級的 Pandas 樣式可視化選項,來提高您使用 Pandas 分析數據的能力。

常見的比如說:

  • 在處理貨幣值時使用貨幣符號。例如,如果您的數據包含值 25.00,您不會立即知道該值是人民幣、美元、英鎊還是其他某種貨幣。
  • 百分比是另一個有用的示,0.05 或 5%?使用百分比符號可以非常清楚地了解如何解釋數據。
  • Pandas 樣式還包括更高級的工具,用于向輸出添加顏色或其他視覺元素。

案例分析

本文將使用一個虛擬數據,為大家進行講解。該數據是一個虛構組織的2018 年銷售數據。

數據集鏈接如下:
https://www.aliyundrive.com/s/Tu9zBN2x81c

1. 導入相關庫,并讀取數據

import numpy as np
import pandas as pd

df = pd.read_excel('2018_Sales_Total.xlsx')

效果如下:圖片讀取這些數據后,我們可以做一個快速總結,看看客戶從我們這里購買了多少以及他們的平均購買金額是多少。為了簡單起見,我這里截取了前 5 項數據。

df.groupby('name')['ext price'].agg(['mean', 'sum'])

結果如下:圖片

2. 添加貨幣符號

當您查看這些數據時,理解數字的比例有點困難,因為您有 6 個小數點和一些較大的數字。此外,目前還不清楚這是美元還是其他貨幣。我們可以使用 DataFrame style.format 解決這個問題。

(df.groupby('name')['ext price']
 .agg(['mean', 'sum'])
 .style.format('${0:,.2f}'))

結果如下:圖片使用 format 函數,可以在數據上使用 python 的字符串格式化工具的所有功能。在這種情況下,我們使用 ${0:,.2f} 放置前導美元符號,添加逗號并將結果四舍五入到小數點后兩位。

例如,如果我們想四舍五入到 0 位小數,我們可以將格式更改為 ${0:,.0f}。

(df.groupby('name')['ext price']
 .agg(['mean', 'sum'])
 .style.format('${0:,.0f}'))

結果如下:圖片

3. 添加百分比

如果我們想按月查看總銷售額,我們可以使用 grouper 按月匯總,并計算每個月占年總銷售額的百分比。

monthly_sales = df.groupby([pd.Grouper(key='date', freq='M')])['ext price'].agg(['sum']).reset_index()
monthly_sales['pct_of_total'] = monthly_sales['sum'] / df['ext price'].sum()

結果如下:圖片為了更加清楚明白的展示這個百分比,我們最好將其轉換為百分數。

format_dict = {'sum':'${0:,.0f}', 'date': '{:%m-%Y}', 'pct_of_total': '{:.2%}'}
monthly_sales.style.format(format_dict).hide_index()

結果如下:圖片

4. 突出顯示數字

除了樣式化數字,我們還可以設置 DataFrame 中的單元格樣式。讓我們用綠色突出顯示最高的數字,用彩色突出顯示最高、最低的數字。

(monthly_sales
 .style
 .format(format_dict)
 .hide_index()
 .highlight_max(color='lightgreen')
 .highlight_min(color='#cd4f39'))

結果如下:圖片

5. 設置漸變色

另一個有用的函數是 background_gradient,它可以突出顯示列中的值范圍。

(monthly_sales.style
 .format(format_dict)
 .background_gradient(subset=['sum'], cmap='BuGn'))

結果如下:圖片

6. 設置數據條

pandas樣式功能還支持在列內繪制條形圖。

(monthly_sales
 .style
 .format(format_dict)
 .hide_index()
 .bar(color='#FFA07A', vmin=100_000, subset=['sum'], align='zero')
 .bar(color='lightgreen', vmin=0, subset=['pct_of_total'], align='zero')
 .set_caption('2018 Sales Performance'))

結果如下:圖片

7. 繪制迷你圖

我認為這是一個很酷的功能。

import sparklines

def sparkline_str(x):
    bins=np.histogram(x)[0]
    sl = ''.join(sparklines(bins))
    return sl
    
sparkline_str.__name__ = "sparkline"
df.groupby('name')['quantity', 'ext price'].agg(['mean', sparkline_str])
聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規問題,請聯系本站處理。 舉報投訴
  • 數據分析
    +關注

    關注

    2

    文章

    1427

    瀏覽量

    34014
  • python
    +關注

    關注

    56

    文章

    4782

    瀏覽量

    84453
收藏 人收藏

    評論

    相關推薦

    數據分析中最常用、最好用的20個Python庫分享

    【導讀】Python在解決數據科學任務和挑戰方面處于領先地位。而一些方便易用的庫則幫助了開發人員高效開發。在這里我們整理了20個在深度學習、數據分析中最常用、
    的頭像 發表于 01-03 09:28 ?5222次閱讀
    <b class='flag-5'>數據分析</b><b class='flag-5'>中最</b>常用、<b class='flag-5'>最好</b>用的20個<b class='flag-5'>Python</b>庫分享

    python數據分析的類庫

    ,因為它太重要了.Pandas庫提供了我們很多函數,能夠快速的方便的,處理結構化的大型數據,不夸張的說,Pandas是讓Python成為強大的數據分
    發表于 05-10 15:18

    怎么有效學習Python數據分析

    包的過程。對于新手,如何學好python,這些很關鍵:Part1:能掌握好Python關鍵代碼以及Pandas、Numpy、Matplotlib、Seaborn這四個基本工具包,便能獨
    發表于 06-28 15:18

    pandas數據分析的方法

    pandas數據分析中常用方法
    發表于 06-03 06:16

    pandas數據分析常見操作

    數據分析-pandas數據處理清洗常用總結
    發表于 08-08 06:46

    基于Python數據分析

    《利用Python進行數據分析》 113日期范圍、頻率和移位
    發表于 05-01 11:24

    成為Python數據分析師,需要掌握哪些技能

    數據驅動問題解決第四、數據分析師要求的三大能力統計學基礎和分析工具應用計算機編碼能力特定應用領域或行業的知識第五數據分析
    發表于 06-23 12:16

    成為Python數據分析師,需要掌握哪些技能

    數據驅動問題解決第四、數據分析師要求的三大能力統計學基礎和分析工具應用計算機編碼能力特定應用領域或行業的知識第五數據分析
    發表于 06-30 11:42

    如何去使用pandas工具

    器學習,本文就介紹了機器學習的基礎內容。提示:以下是本篇文章正文內容,下面案例可供參考一、pandas是什么?示例:pandas 是基于NumPy 的一種工具,該工具是為了解決
    發表于 08-24 06:49

    機器學習開發課程,使用Pandas探索數據分析

    Pandas是一個Python庫,提供了大量數據分析的方法。數據科學家經常和表格形式的數據(比如.csv、.tsv、.xlsx)打交道。
    的頭像 發表于 03-14 18:07 ?4795次閱讀

    12種用于數據分析Pandas技巧可用來學習Python詳細概述

    如果你正開始學習Python,而且目標是數據分析,相信NumPy、SciPy、Pandas會是你進階路上的必備法寶。尤其是對數學專業的人來說,Pandas可以作為一個首選的
    的頭像 發表于 05-19 11:40 ?5306次閱讀

    pandas的快速入門介紹

    pandas 是基于NumPy 的一種工具,該工具是為了解決數據分析任務而創建的。Pandas 納入了大量庫和一些標準的
    發表于 06-03 08:00 ?0次下載
    <b class='flag-5'>pandas</b>的快速入門介紹

    Python工具pandas篩選數據的15個常用技巧

    pandasPython數據分析必備工具,它有強大的數據清洗能力,往往能用非常少的代碼實現較復雜的數據
    的頭像 發表于 03-30 10:44 ?2850次閱讀
    <b class='flag-5'>Python</b><b class='flag-5'>工具</b><b class='flag-5'>pandas</b>篩選<b class='flag-5'>數據</b>的15個常用技巧

    從Excel到Python數據分析進階指南資源下載

    從Excel到Pytho  Excel是數據分析中最常用的工具,本書通過Python與Excel的功能對比介紹如何使用Python通過函數式
    發表于 04-06 09:44 ?0次下載
    從Excel到<b class='flag-5'>Python</b><b class='flag-5'>數據分析</b>進階指南資源下載

    Anaconda:Python 數據分析與挖掘好幫手

    Python進行數據分析的時候,你會不會煩惱要安裝那么多的模塊?比如Pandas、Numpy、matplotlib、scipy等等,而當你接手的項目是由不同的Python版本編寫的時
    的頭像 發表于 11-02 16:00 ?565次閱讀
    Anaconda:<b class='flag-5'>Python</b> <b class='flag-5'>數據分析</b>與挖掘好幫手