這次是在我開始就業後首次參加 IT 鐵人賽,由於工作上較常使用到 pandas,而且 pandas 在處理資料上也經常被使用,俗稱為 Python 版的 Excel,所以想說以 pandas 當作主題,順便檢驗是否有更了解自己學習的技能。
決定選用的書為 Wes McKinney 的「Python 資料分析,使用 pandas、NumPy 和 Jupyter 進行資料整理」。
前言 這本書主要是在 Python 中操作、處理、清理和處理資料的各種細節,雖然本書的名字裡有「資料分析」,但本書的重點仍然是 Python 程式設計、程式庫...
為什麼要使用 Python 來分析資料? 對很多人而已,使用 Python 來設計程式有很強的吸引力。 自 1991 年問世以來,Python、Perl、Ru...
重要的 Python 程式庫 (上) 主要為不熟悉 Python 資料生態的所使用的程式庫,做一個簡單的介紹。 NumPy NumPy 是 Numerical...
重要的 Python 程式庫 (下) 接續上次的內容繼續介紹 Python 所使用的程式庫。 matplotlib matplotlib 是經常用於繪製圖表和...
執行 Jupyter Notebook notebook 是 Jupyter 專案的主要元素之一,它是一種互動式文件,可容納程式碼、文字、Markdown 語...
pandas 資料結構 在開始使用 pandas 之前,必須先知道兩個主要資料結構,Series 與 DataFrame。 Series Series 是一維...
Series (上) 接續上次的內容,Series 也可以視為一個長度固定且有序的字典,因為它儲存索引值和資料值的對映關係,它可以在許多適合使用字典的情況下使...
Series (下) 接續上一次的內容,Series 在許多應用還有一個好用的特性,在進行算術運算時,會自動按照索引標籤對齊: In [40]: obj3 O...
DataFrame (一) DataFrame 是一種矩形的資料表,裡面有許多有序的、有名稱的直欄 (column),每一欄都可以使用不同的值型態 (數字、字...
DataFrame (二) 接續上次的話題,如果指定一系列的欄 (column),DataFrame 的欄將按照那個順序來排列: In [53]: pd.Da...