pythonでどうやって音声ノイズ除去を行うか
音声のノイズ除去には、Pythonのlibrosaライブラリが使用できます。以下に簡単なサンプルコードを示します。
import librosa
import numpy as np
import soundfile as sf
# 读取音频文件
audio, sr = librosa.load('input.wav', sr=None)
# 计算短时傅里叶变换(STFT)
stft = librosa.stft(audio)
# 计算音频的能量谱
power = np.abs(stft) ** 2
# 设置阈值(根据实际情况调整)
threshold = np.mean(power) * 0.5
# 将低于阈值的能量谱置为0
mask = power < threshold
power[mask] = 0
# 逆短时傅里叶变换(ISTFT)得到降噪后的音频
denoised_stft = np.sqrt(power) * np.exp(1j * np.angle(stft))
denoised_audio = librosa.istft(denoised_stft)
# 保存降噪后的音频文件
sf.write('output.wav', denoised_audio, sr)
上のコードでは、まずlibrosaライブラリで音源ファイルを読み込み、音源の短時間フーリエ変換(STFT)を計算します。次に、音源のスペクトラムを計算し、閾値より下のスペクトルを0にします。最後に、逆短時間フーリエ変換(iSTFT)を使って、スペクトルを音源信号に戻し、ノイズを軽減した音源ファイルを保存します。最適なノイズ軽減効果を得るには、状況に応じて閾値を調整してください。