データをPythonで整理する方法

Pythonでデータを整えるには、pandasやnumpyなどの関連するライブラリをインポートする必要があります。次に、pandasライブラリのDataFrameを使用して、データを格納して整理するためのデータフレームを作成できます。

以下、Python と Pandas を使ったデータの整理を行うサンプルコードを示します。

import pandas as pd
import numpy as np
# 创建一个示例数据框
data = {'姓名': ['张三', '李四', '王五', '赵六'],
'年龄': [20, 25, 30, 35],
'性别': ['男', '女', '男', '女'],
'成绩': [80, 90, 85, 95]}
df = pd.DataFrame(data)
# 查看数据框的前几行
print(df.head())
# 查看数据框的统计摘要信息
print(df.describe())
# 按某一列排序数据框
df_sorted = df.sort_values('年龄')
print(df_sorted)
# 筛选出满足条件的行
df_filtered = df[df['成绩'] > 85]
print(df_filtered)
# 添加新的列到数据框
df['年级'] = ['大一', '大二', '大三', '大四']
print(df)
# 删除某一列或行
df_drop_column = df.drop('年龄', axis=1)
df_drop_row = df.drop(2)
print(df_drop_column)
print(df_drop_row)

上掲のコードでは、まずサンプルデータフレームを作成し、データフレームの最初の数行と統計サマリー情報の表示、データフレームを特定の列でソートする方法、条件に一致する行をフィルターする方法、新しい列をデータフレームに追加する方法、列または行を削除する方法を示します。これらはよく使用されるデータ整理操作です。要件に応じて、これらのサンプルコードを修正および調整できます。

bannerAds