Last updated
Was this helpful?
Last updated
Was this helpful?
參考資料:() 參考資料:()
Python 的一種數據分析 lib 提供主要兩種資料結構 DataFrame & Series 透過載入至資料結構物件後,可以使用物件提供的方法,來快速進行前處理(資料補值、空值去除、取代) 更多的輸入、輸出整合,EX:從DB讀取資料,將處理完的資料倒回DB
用來處理時間序列相關的資料 (如感測器資料) 主要為建立索引的一維陣列
則是用來處理結構化 (Table like) 的資料 有 列索引 與 欄標籤 的二維資料 例如:關聯式資料庫、CSV
用來處理有資料、索引、列索引、欄標籤 的三維資料集。
.sort_index()
.sort_values()
isnull()
notnull()
isna()
isin(value)
dropna() #有 null 都刪除
fillna(0) #有null 都補0
fillna({'key': "NULL", "key2": 0}) #依照欄位補值
df.duplicated('columnName')
.between(value1,value2)
df.loc[index, column] = value
df.rename(columns = {column : cloumn_modify})
1 和 2 改為 1,3 和 4 改為 2 df[column].replace({1:1, 2:1, 3:2, 4:2}, inplace=True) #inplace=True 才會寫入
return 列數、欄數
return 描述性統計
count 筆數 mean 平均數 std 標準差 min 最小值 25% 各四分位數 50% 75% max 最大值
return 前五筆 (可代入 n,則回傳 n 筆)
return 後五筆 (同上)
return 欄位名稱
return index
return 資料內容
參考資料:()