Boards - 学習記録

dychw

2020-08-22に投稿

Week4

Coursera

Non-linear Hypotheses

Q. ロジスティック回帰があるのに、なぜNNを使うのか？

特徴がx_1, x_2だけであればロジスティック回帰で良い。
しかしx_1〜x_100もの数を扱うとなると、それらを二次や三次の方程式で表したx_1^3やx_1 * x_2といった特徴も扱うことになり、合計で5000以上の特徴を扱う必要が出る。
特徴が多いとオーバーフィットにつながり、また計算コストが高くなる。
この問題は画像認識を解く際、特に顕著になる。

Model Representation I

ニューラルモデル

x_0はbiasを表すが、常に1なので省略する時もある。
この講義ではθをparameterと呼ぶが、weightと呼ぶ人もいる。

次元sの計算

jがレイヤーのインデックス、sがユニットの数だとする。
下の例ではs_1=2、s_2=4となる。

この時のΘの次元は下記の式で求めることができる。

先の例に当てはめると、4*(2+1)から次元は4*3であることがわかる。

dychw

Boards - 学習記録

所有者限定モードのためこのボードには投稿できません

ボードとは？

コメント

Boards - 学習記録

投稿月

# 2020年11月 (1)

# 2020年10月 (3)

# 2020年09月 (7)

# 2020年08月 (21)

# 2020年07月 (11)

# 2020年06月 (8)

# 2020年05月 (10)

# 2020年04月 (15)

# 2020年03月 (10)

# 2020年02月 (11)