scikit-learn(サイキットラーン)は、Pythonで機械学習を始めるなら必ず知っておきたいライブラリです。この記事では、scikit-learnの概要と、インストール方法、そして基本的な使い方までをわかりやすく解説します。
コマンドプロンプトやターミナルで以下のコマンドを実行します。
pip install scikit-learn
すでにインストール済みの場合や最新版にアップデートしたい場合は、次のコマンドを使います。
pip install -U scikit-learn
MacやLinuxの場合はpip3
を使うこともあります。
Anacondaを利用している場合は、以下のコマンドでインストールできます。
conda install scikit-learn
Google Colabではscikit-learnが標準でインストールされているため、追加インストール不要です。
インストールが完了したら、Pythonで下記コードを実行してバージョンが表示されれば成功です。
import sklearn
print(sklearn.__version__)
scikit-learnには有名なサンプルデータセットが付属しています。まずはIrisデータセットを使ってみましょう。
from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target
学習用とテスト用にデータを分割します。
from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)
ここではk近傍法(KNN)を使います。
from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier()
model.fit(X_train, y_train)
accuracy = model.score(X_test, y_test)
print("精度:", accuracy)
pip install scikit-learn
またはconda install scikit-learn
で簡単まずはインストールして、サンプルコードを動かしてみましょう!