SeabornのDistplot: 詳解

みなさん、こんにちは!この記事では、SeabornのDistplotについて詳しく説明します。


シーボーンのDistplotとは何ですか?

ディストプロットまたは分布プロットは、データの分布の変動を描写します。Seabornのディストプロットは、連続データ変数の全体的な分布を表します。

SeabornとMatplotlibモジュールを使って、distplotをさまざまなバリエーションで表示します。distplotは、ヒストグラムとそれに組み合わせた線でデータを表します。


SeabornのDistplotを作成する。

PythonのSeabornモジュールには、データをプロットし、データの変動を示すための様々な関数が含まれています。seaborn.distplot()関数は、distplotをプロットするために使用されます。distplotは、単変量データの分布、つまり変数の密度分布に対するデータの分布を表します。

文法:

seaborn.distplot()

seaborn.distplot()関数は、データ変数を引数として受け入れ、密度分布を持つプロットを返します。

例えば、私たちが友達の誕生日を祝うためにパーティーを開くことを考えてみましょう。

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(200)
res = sn.distplot(data)
plt.show()

私たちはnumpy.random.randn()関数を使用してランダムなデータ値を生成しました。さらに、pyplot.show()関数はプロットを表示するために使用されます。

出力する

Creating A DistPlot

例2:
Following the event, all participants are required to submit a feedback form.

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
import pandas as pd

data_set = pd.read_csv("C:/mtcars.csv")
data = pd.DataFrame(data_set['mpg'])
res = sn.distplot(data)
plt.show()

pandas.read_csv() 関数は、データセットを Python 環境に読み込みます。

出力:

Creating A DistPlot Using A Dataset

DistPlotの軸にラベルを追加する。

シーボーンのディストプロットは、以下の構文を使用してデータ値をPandasシリーズに変換することで、軸のラベルを提供することができます。

文章構造:

pandas.Series(data,name='name')
seaborn.distplot()

パンダのシリーズには、データ軸のラベルを設定するためのパラメーター「name」が含まれています。

「こんにちは、元気ですか?」
Translation: おはよう、元気かい? (Ohayou, genki kai?)

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(200)
res = pd.Series(data,name="Range")
plot = sn.distplot(res)
plt.show()

出力:

Creating A DistPlot Using Series

SeabornのDistPlotとカーネル密度推定プロット

SeabornのDistplotは、カーネル密度推定プロットと組み合わせることもでき、連続変数の分布の確率をさまざまなデータ値に対して推定することができます。

文法:

seaborn.distplot(data,kde=True)

Kernel Density Plotとdistplotを有効にするために、kdeパラメータをTrueに設定します。

例えば:

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,kde=True)
plt.show()

出力されるもの:

DistPlot With KDE

SeabornのDistPlotとRug Plotでデータを可視化する。

私たちは、一変数データ変数に関連してデータの分布をビンに対してマッピングするために、SeabornのDistplotとRug Plotを使用できます。Rug Plotは、データの分布をビンの形式で視覚化します。

文法:

seaborn.distplot(data, rug=True, hist=False)

“ラグプロット分布を有効にするには、’rug’パラメータをTrueに設定する必要があります。”

例:

英語: “I like to eat sushi.”
日本語: “私は寿司を食べるのが好きです。”

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)
res = pd.Series(data,name="Range")
plot = sn.distplot(res,rug=True,hist=False)
plt.show()

出力:

DistPlot With Rug Plot

SeabornのDistplotを垂直軸にプロットします。

以下の構文を使用して、全体のDistplotをy軸にプロットすることができます。

構文:

seaborn.distplot(data,vertical=True)

ディストプロットをy軸にプロットするには、’vertical’パラメータをTrueに設定する必要があります。

“I want to eat sushi today.”

今日は寿司を食べたいです。

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

data = np.random.randn(100)

plot = sn.distplot(data,vertical=True)

plt.show()

以下の文を日本語で適切に言い換えることができます。

出力:

DistPlot With Vertical Axis

seaborn.set()関数を使用して異なるスタイルを設定します。 (使用する異なるスタイルを設定するためにseaborn.set()関数を利用してください。)

Seabornには、プロットに追加の背景機能を追加するためのいくつかの組み込み関数があります。seaborn.set()関数は、分布プロットの背景を異なるものに設定するために使用されます。

文法:

seaborn.set(style)

I am going to the store to buy some groceries.

Japanese paraphrase: お店に行って食料品を買いに行く予定です。

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt
sn.set(style='dark',)
data = np.random.randn(500)

plot = sn.distplot(data)

plt.show()

出力: オプションは日本語でのプレーンテキスト結果のみが必要です。

DistPlot With Different Background

SeabornのDistPlotにカスタムカラーを設定します。

seaborn.distplot() 関数の ‘color’ パラメータを使用して、データの視覚化に色を設定することができます。

構文:

seaborn.distplot(data, color='color')

1. この本はとても面白かったので、おすすめです。
2. この書籍は非常に魅力的だったので、お勧めします。
3. この本はとても興味深いので、おすすめです。

import numpy as np
import seaborn as sn
import matplotlib.pyplot as plt

sn.set(style='dark',)
data = np.random.randn(500)
plot = sn.distplot(data,color='purple')

plt.show()

出力:

DistPlot With Different Color

結論

したがって、SeabornモジュールとMatplotlibモジュールはデータの視覚化をサポートし、データの分布を表現します。

データの視覚化の基礎を理解するために、PythonのMatplotlibモジュールをすべての読者に強くお勧めします。


参考文献

  • Seaborn distplot() function – Documentation
コメントを残す 0

Your email address will not be published. Required fields are marked *