sckit-learn データセットを使った機械学習 分類編1

digitsデータセット読み込み表示

from sklearn import datasets
digits = datasets.load_digits()
#読み込みデータ表示
#digits.dataが入力データ
#digits.targetが判別結果
print(digits.data)  
[[  0.   0.   5. ...,   0.   0.   0.]
 [  0.   0.   0. ...,  10.   0.   0.]
 [  0.   0.   0. ...,  16.   9.   0.]
 ...,
 [  0.   0.   1. ...,   6.   0.   0.]
 [  0.   0.   2. ...,  12.   0.   0.]
 [  0.   0.  10. ...,  12.   1.   0.]]
digits.target
array([0, 1, 2, ..., 8, 9, 8])

#画像形式に変換して2行5列に表示
import matplotlib.pyplot as plt
#.target[:10]で9までのラベル,.images[:10]で9までの画像を取得
for label, img in zip(digits.target[:10], digits.images[:10]):
	plt.subplot(2, 5, label + 1)
	plt.axis('off')
	plt.imshow(img, cmap=plt.cm.gray_r, interpolation='nearest')
	plt.title('Digit: {0}'.format(label))

plt.show()

f:id:kobakenkken:20170809103358p:plain

参考
scikit-learn に付属しているデータセット – Python でデータサイエンス