Seabornの折れ線グラフによるデータの視覚化

みなさん、こんにちは!この記事では、Seabornのチュートリアルを進めていき、Seabornの折れ線グラフについて理解していきます。最近はSeabornのヒートマップについても取り上げましたので、ヒートマップについてもっと学びたい方はぜひご覧ください。


Line Plotとは何ですか?

データセット上で構築されたモデルによって予測結果を分析し、データの変動を視覚化するために、Seabornはライブラリとして使用されます。

シーボーンの折れ線グラフは、連続値とカテゴリ値の関係を連続的なデータポイント形式で表現します。

以下のデータセットを使用して、データを操作しラインプロットを形成していくために、この記事では紹介します。先に進む前に、以下のデータセットのスナップショットをご覧ください。

以下のデータセットでは、データ変数「cyl」「vs」「am」「gear」「carb」はカテゴリ変数であり、すべてのデータ値が特定のカテゴリや値の範囲に含まれているためです。

残りのデータ列は、離散的な整数値を持っているため、整数/連続変数の範疇に当てはまります。

入力データセット:

MTCARS Dataset

最初のSeaborn折れ線グラフのプロットを講義します。

「ラインプロットを始めるためには、以下のコマンドを使用して、SeabornライブラリをPython環境にインストールし、インポートする必要があります。」

文法:

pip install seaborn

インストールが完了したら、ライブラリを現在の作業環境にインポートして、機能を使用してください。

文法:

import seaborn

「シーボーン」シリーズ全体で、データをプロットして適切な可視化方法で表示するために、Matplotlibライブラリを使用します。


Seabornを使用して単一のラインプロットを作成する。

シーボーンの折れ線グラフを作成するために、離散値を提供するか、データセットを使用することができます。

文法: 文の構造及び言語のルール

seaborn.lineplot(x, y, data)
  • x: Data variable for the x-axis
  • y: The data variable for the y-axis
  • data: The object pointing to the entire data set or data values

例1:ランダムデータを使用して、Seabornの折れ線グラフを作成する。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

Year = [2012, 2014, 2016, 2020, 2021, 2022, 2018]
Profit = [80, 75.8, 74, 65, 99.5, 19, 33.6]

data_plot = pd.DataFrame({"Year":Year, "Profit":Profit})

sns.lineplot(x = "Year", y = "Profit", data=data_plot)
plt.show()

以下の折れ線グラフでは、「年」と「利益」という2つのデータ変数の間の直線的な関係が観察できます。

出力:

LinePlot Example 1

例2:データセットを使用して、データ列間の関係を示すために折れ線グラフを作成する。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg",data=info)
sns.set(style='dark',)
plt.show()

入力データセット: 入力データの集合

Input Dataset Seaborn LinePlot

出力:

LinePlot Example 2

複数のシーボーンの折れ線グラフを表示します。 (Fukusū no shībōn no ore-sen gurafu o hyōji shimasu.)

同じスペースやプロット内でデータを可視化するために、複数の線を作成することができます。同じデータの列または複数のデータ変数を使用して、それらの関係を一緒に表現することができます。

複数のデータポイントに対して色の色相を作成するために、色相パラメータを使用する。

パラメータ「色相(hue)」はデータセットの異なる変数をグループ化するために使用され、x軸とy軸のデータ列と、パラメータに渡された列との関係を示すのに役立ちます。

文法:

seaborn.lineplot(x,y,data,hue)

とても寒い日ですね。

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl")
plt.show()

下のプロットで表示されているとおり、3つの異なる色調で表された3本の線は、「drat」、「mpg」、「cyl」の関係を描写しています。

結果:

Multiple Seaborn LinePlot

2. 異なる種類の線を描画するためにスタイルパラメータを使用する。

私たちは、x軸とy軸と一緒に表示したい値と、さまざまな線のスタイル(破線、点線(マーカー)、など)を指定するために、スタイルパラメータを設定することができます。

文法:

seaborn.lineplot(x, y, data, style)

例2:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,:5]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="cyl", style="cyl")
plt.show()

明らかに見ると、プロットは異なる線の構造、つまり実線、破線、マーカーを用いて、’mpg’と’drat’との関係で’cyl’の値を示しています。

出力:

Line Plot With style Parameter

3. サイズパラメータを使用して、Seabornで複数の折れ線グラフをプロットする。

seaborn.lineplot() 関数の size パラメーターを使えば、プロットする線の大きさを変えることで、複数のデータ変数の関係性を表現することができます。そのため、データの大きさに応じて異なる大きさ/幅のグループ分け変数として機能します。

文法:

seaborn.lineplot(x, y, data, size)

3つ目の例:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear",style="gear",size="gear")
plt.show()

入力データセット:

Dataset For Multiple Line Plot

出力:

Line Plot With size Parameter

ラインプロットに異なるカラーパレットを使用する

Seabornのカラーマップとパレットは、可視化モデルの色範囲を定義します。パラメータのパレットとhueを使用することで、データ変数に基づいた色のエンコーディングスキームを決定することができます。

もっとカラーパレットが欲しい場合は、こちらのリンクを参照してください:カラーパレット

文法:

seaborn.lineplot(x,y,data,hue,palette)

例:
– Can you help me with my homework?

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt
 
data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "drat", y = "mpg", data=info, hue="gear", palette = "Set1")
plt.show()

出力:

Line Plot Palette

折れ線グラフにエラーバーを追加する。

ラインプロットでは、err_styleパラメータを使用してプロット内の信頼レベル/区間を定義し、エラー率を表示することができます。

文法:

seaborn.lineplot(x,y,data,err_style="bars")

There are many benefits to exercising regularly, such as improving physical health, boosting mood, and increasing energy levels. Additionally, regular exercise can help prevent chronic diseases and maintain a healthy weight.

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info, err_style="bars")
plt.show()

出力:

Line Plot With err_style Parameter

seaborn.set() 関数を使用して異なるスタイルを設定する

Pythonのseaborn.set()関数を使うと、プロットを異なる背景スタイルで表示することができます。

文法:

seaborn.set(style)

例えば:

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

data = pd.read_csv("C:/mtcars.csv")
info = data.iloc[1:20,]
sns.lineplot(x = "cyl", y = "mpg",data=info,hue="gear")
sns.set(style='dark',)
plt.show()

出力:

Line Plot With set() function

結論

したがって、この記事では、ラインプロットとそれに関連するバリエーションを理解しました。

Python Matplotlibのチュートリアルを読むことを読者に強くおすすめします。そうすれば、より良い方法で折れ線グラフを理解することができます。


参考文献

  • Seaborn Line Plot – Official Documentation
コメントを残す 0

Your email address will not be published. Required fields are marked *