scikit-learn入門:インストールから基本の使い方まで

scikit-learn(サイキットラーン)は、Pythonで機械学習を始めるなら必ず知っておきたいライブラリです。この記事では、scikit-learnの概要と、インストール方法、そして基本的な使い方までをわかりやすく解説します。


scikit-learnとは?

  • Pythonで動作する機械学習用のライブラリ
  • 分類・回帰・クラスタリング・次元削減など多彩なアルゴリズムを搭載
  • データの前処理からモデル構築、評価まで一貫して実施可能
  • NumPyやPandas、Matplotlibなどと高い互換性

scikit-learnのインストール方法とインストール確認

インストール方法

pipを使ったインストール(推奨)

コマンドプロンプトやターミナルで以下のコマンドを実行します。

pip install scikit-learn

すでにインストール済みの場合や最新版にアップデートしたい場合は、次のコマンドを使います。

pip install -U scikit-learn

MacやLinuxの場合はpip3を使うこともあります。

condaを使ったインストール(Anaconda環境の場合)

Anacondaを利用している場合は、以下のコマンドでインストールできます。

conda install scikit-learn

Google Colabの場合

Google Colabではscikit-learnが標準でインストールされているため、追加インストール不要です。

インストール確認

インストールが完了したら、Pythonで下記コードを実行してバージョンが表示されれば成功です。

import sklearn
print(sklearn.__version__)

scikit-learnの基本的な使い方

データの準備

scikit-learnには有名なサンプルデータセットが付属しています。まずはIrisデータセットを使ってみましょう。

from sklearn.datasets import load_iris
iris = load_iris()
X, y = iris.data, iris.target

データの分割

学習用とテスト用にデータを分割します。

from sklearn.model_selection import train_test_split
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

モデルの選択と学習

ここではk近傍法(KNN)を使います。

from sklearn.neighbors import KNeighborsClassifier
model = KNeighborsClassifier()
model.fit(X_train, y_train)

予測と評価

accuracy = model.score(X_test, y_test)
print("精度:", accuracy)

まとめ

  • scikit-learnはPythonで機械学習を始めるのに最適なライブラリ
  • インストールはpip install scikit-learnまたはconda install scikit-learnで簡単
  • サンプルデータを使って、データ分割→学習→予測→評価まで一連の流れを体験できる

まずはインストールして、サンプルコードを動かしてみましょう!

にいやん

出身 : 関西 居住区 : 関西 職業 : 組み込み機器エンジニア (エンジニア歴13年) 年齢 : 38歳(2022年11月現在) 最近 業務の効率化で噂もありPython言語に興味を持ち勉強しています。 そこで学んだことを記事にして皆さんとシェアさせていただければと思いブログをはじめました!! 興味ある記事があれば皆さん見ていってください!! にほんブログ村