Pandasライブラリを使用してデータをフィルタリングの方法

2年 ago

結衣, 春花

1 minute

Pandasライブラリを使用してデータフィルターを実行するには、次の手順に従います。

Pandasライブラリのインポート：
import pandas as pd
データを読み取る：
data = pd.read_csv(‘data.csv’) # CSVファイルからデータを読み込み
データを表示する:
print(data.head()) # データの先頭数行を表示します
データのフィルタリング
単一条件のフィルタリング：
filtered_data = data[data[‘column_name’] > threshold] # あるカラムが閾値より大きいデータのフィルタリング
複数の条件で絞り込みを行う（論理演算子を使用する場合）：
filtered_data = data[(data[‘column1’] > threshold1) & (data[‘column2’] < threshold2)] # すべての条件を満たすデータの絞り込み、AND演算子(&) を使用 filtered_data = data[(data[‘column1’] > threshold1) | (data[‘column2’] < threshold2)] # いずれかの条件を満たすデータの絞り込み、OR演算子(|) を使用
特定の値を絞り込む:
filtered_data = data[data[‘column_name’].isin([‘value1’, ‘value2’, ‘value3’])] # 指定した列がある値を含むデータを絞り込む
文字列照合を使って、’column_name’列のあるパターンを含むデータのフィルタリング：
filtered_data = data[data[‘column_name’].str.contains(‘pattern’)]
絞り込み結果を表示する：
filtered_data.head()で絞り込んだデータを確認

以上の操作が、Pandasライブラリを用いたデータの絞り込みの基本的なステップとなります。具体的な要求やデータの特徴に応じて、適宜絞り込み操作を行ってください。