Kaggle

PlotlyExpressどの程度使えるものなのか?私なりに検証してみた。

この記事の目的 EDA(探索的データ解析)を行う際PlotlyExpressが「どんなケースで使用することができるのか?」について私なりに検証してみました。 PlotlyExpressとは? plotlyのラッパーになります。 plotlyとはオープンソースでインタラクティブなデータ可…

リッジ、ラッソ、SGD回帰をsklearnでやってみた

import numpy as np import pandas as pd import matplotlib.pyplot as plt from sklearn import model_selection, preprocessing, linear_model import sklearn sklearn.__version__ #dataset load df=pd.read_csv('https://archive.ics.uci.edu/ml/machine…

pythonで、時系列データを用いて教師あり学習を行うための学習データ作成方法

時系列データを用いて教師あり学習を行うための学習データの作成のための考え方 多変量の時系列データを用いて、教師あり学習によって、ある目的変数のt分後の値の推測したい場合の学習データの作成方法をまとめたいと思います。 この一般的な方法としては、…

時系列データ分析手法のチートシート

このサイトがとても勉強になった。 https://machinelearningmastery.com/time-series-forecasting-methods-in-python-cheat-sheet/

正規化と標準化の使い分ける一般的な考え方

一般的には標準化を使用する。 正規化の場合、外れ値が大きく影響するためである。 ※画像データの場合は学習コストを下げるため、[0,1]の範囲に収まるよう255.0で割ることで正規化するのが一般的 正規化 使用ケース: - 画像(RGBの強さ[0,255]) - sigmoid, …

Google ColabでKaggle! 【STEP1: Kaggle APIの設定とか】

Google Colabを起動 自分のGoogleアカウントからGoogle Colabを起動して開いて下さい Google Drive>新規>その他>Colaboratory kaggle APIのインストール !pip install kaggle Kaggle API Keyをダウンロードする Kaggleを開いて自分のアカウントページを開…