Entries from 2019-07-01 to 1 month

正規化と標準化の使い分ける一般的な考え方

一般的には標準化を使用する。 正規化の場合、外れ値が大きく影響するためである。 ※画像データの場合は学習コストを下げるため、[0,1]の範囲に収まるよう255.0で割ることで正規化するのが一般的 正規化 使用ケース: - 画像(RGBの強さ[0,255]) - sigmoid, …

数値的データの前処理手法のまとめ(仮)

http://jotkn.ciao.jp/wp/2017/08/23/post-92/

カテゴリカルEncoding手法のまとめ(仮)

jotkn.ciao.jp

機械学習する上でのフォルダ構成

とても分析とか機械学習モデルをしていく上で参考になるフォルダ構成があったので共有しておきます。 https://qiita.com/Hironsan/items/4479bdb13458249347a1 https://www.st-hakky-blog.com/entry/2017/03/24/140738

データの全体の概要をpandas_profilingを使うとものすごく便利な件

pandas_profilingを使うことで、まず手始めに1カラムごとにどんなデータなのかを見たりすることが必要なくなる。 あとは この記事を見てください。w dev2prod.site