Kaggle’s 30 Days of ML をやってみたメモを記録していく
内容:
オリジナルの記事はこちら
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
import optuna.integration.lightgbm as lgb
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
Optuna
を使うとハイパーパラメータを最適化できるらしいので、試してみたい
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
Code
タブのNew Notebook
ボタンで作成できるOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
XGBRegressor
を使う
n_jobs
で使用するコア数を指定できる
n_estimators
: 100~1000くらいearly_stopping_rounds
: 5くらい?learning_rate
: デフォルトは0.1Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
Pipeline
を使うcross_val_score()
を使う
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
RandomForestRegressor
を使って、家の価格の予測をしてみる(Intro to ML Courseのおさらい的な感じ)Imputer
のfit_transform()
とtransform()
の違いについてはこちらを参照OrdinalEncoder
を使うOneHotEncoder
を使う
handle_unknown='ignore'
, sparse=False
にするOneHotEncoder
を生成し、カテゴリデータの各列に適用するindex
が削除されてしまうので、それを元に戻すOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
train.csv
など)を使って学習するtest.csv
など)を使って予測するJoin Competition
ボタンをクリックしておくSave Version
ボタンをクリックするSave and Run All
オプションを選択し、Save
ボタンをクリックするSave Version
ボタンの右にある、数字のボタンをクリックするVersion History
にて、提出したいバージョンの右側にある...
をクリックするSubmit to Competition
> Submit
を選択するOpen in Viewer
> Output
タブ(画面右側) > Submit
> Submit
を選択するNaN
が含まれる箇所はfillna()
関数で置換することで対応できたOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
RandomForestRegressor
を使うOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
data.columns
で列の見出しを取得data.列名
で列のデータを取得data[列見出しリスト]
で、指定した複数列のデータを取得data.head()
で先頭の5行を取得train_test_split()
でテストデータと検証データの分割ができるmean_absolute_error()
で平均絶対誤差を取得できるOriginaly published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
data = pd.read_csv()
data.describe()
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
from math import *
print(pi, log(32, 2))
type()
dir()
help()
Originally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
'
または"
で囲む
'
が含まれるときは"
で囲むと便利'
"
\
を含める場合、前に\
をつける\n
で改行可能"""
で囲むと、中の文が改行された位置で(\n
をつけなくても)改行されるstr()
で文字列に変換する"{}, you'll always be the {}th planet to me.".format(planet, position)
のように書くfor i, item in enumerate(item_list)
str.rstrip()
で引数の文字を探して除去するOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
-x
を指定すると、リストの最後からx
番目の要素にアクセスできるリスト[a:b]
のように書くことで、a
番目からb
番目の要素のリストを取得できる
a
を省けば最初からb
番目までb
を省けばa
番目から最後まで要素 in リスト
で、リスト内に要素が含まれるか確認できる( )
または括弧なし, Listは[ ]
で囲むnumerator, denominator = x.as_integer_ratio()
len()
を使うと、内包されるListが一つの要素として数えられるfor 要素 in リスト等
のように書く[num for num in nums if num < 0]
みたいな書き方もできるOriginally published at marshmallow444.github.io
Kaggleの初心者向けプログラム「30 Days of ML」に挑戦中。
True
かFalse
bool()
でbool型に変換できるand
or
not
and
があれば、これが優先されるif
elif
else
:
と
(半角スペース)を入れるif 条件:
←半角スペース4つでインデントを下げて処理を書く
インデントをやめるとブロックの終わりになる
値1 if 条件 else 値2
Originally published at marshmallow444.github.io