Pythonで特定の列でデータを分割する方法
你可以使用pandas库中的groupby函数来按某一列拆分数据。
以下にサンプルコードを示します。
import pandas as pd
# 创建一个示例数据集
data = {
'Name': ['Tom', 'Nick', 'John', 'Tom', 'Nick', 'John'],
'Age': [20, 25, 30, 35, 40, 45],
'City': ['New York', 'London', 'Paris', 'New York', 'London', 'Paris']
}
df = pd.DataFrame(data)
# 按照City列拆分数据
grouped = df.groupby('City')
# 遍历每个分组
for city, group in grouped:
print(city)
print(group)
print()
ネイティブな日本語で言い換えます。1つの選択肢のみ必要です。
London
Name Age City
1 Nick 25 London
4 Nick 40 London
New York
Name Age City
0 Tom 20 New York
3 Tom 35 New York
Paris
Name Age City
2 John 30 Paris
5 John 45 Paris
以上のサンプルコードでは、名前、年齢、都市を含むデータセットを作成し、都市列に基づいて分割しました。次に、groupby関数を使用してグループ化し、各グループを反復処理し、出力します。
各グループには統計量の計算、カスタム関数の適用など、必要に応じて他の操作を実行できます。