Kaggle用Python

Pythonの知識の復習

ifの時は:が要る。returnではいらない。

Pythonの関数定義でデフォルト引数を設定すると、関数呼び出し時に引数を省略した場合にデフォルト値が使用されるようになる。—> 前処理関数に使うと実験しやすいっぽい。

def fill_age(df, method="mean"):
if method == "mean":
df["Age"] = df["Age"].fillna(df["Age"].mean())
elif method == "median":
df["Age"] = df["Age"].fillna(df["Age"].median())
else:
df["Age"] = df["Age"].fillna(0)
return df

年齢(Age)に欠損があるから、とりあえず平均で埋めたい。
でも後で 中央値 とか 0 とかも試したい。

A.csvの最初5行目を見たい時は、

A.head()

https://note.nkmk.me/python-pandas-len-shape-size/

pandasのcsv–>DataFrameでできたオブジェクトの属性として, df_train.shapeで(行数, 列数) のタプルを返す。

目的 使うもの
中身の例を見る head()
行×列のサイズ shape
欠損・型・概要 info()

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です