pandasで特定の列のテキストデータを削除する方法は何ですか?
str.replace() メソッドを使用して、特定の列のデータからテキストを削除することができます。
最初に、str.replace()メソッドを使用して削除したいテキストを空の文字列に置き換えます。その後、置換した結果を元の列に代入します。
以下はサンプルコードです。
import pandas as pd
# 创建示例数据
data = {'col1': ['apple', 'banana', 'orange'],
'col2': ['apple123', 'banana456', 'orange789']}
df = pd.DataFrame(data)
# 删除col2列中的文字
df['col2'] = df['col2'].str.replace(r'\D+', '')
print(df)
結果を出力します。
col1 col2
0 apple 123
1 banana 456
2 orange 789
上記の例で、非数字の文字に一致するために正規表現r’\D+’を使用しました。一致した文字を空文字列で置き換えることで、テキストを削除しました。
注意:上記の例では、置換後の結果を元の列df[‘col2’]に代入しています。元の列を保持しつつ、置換後の結果を新しい列に格納したい場合は、df[‘new_col’] = df[‘col2′].str.replace(r’\D+’, ”)を使用してください。