pythonでどうやって音声ノイズ除去を行うか

音声のノイズ除去には、Pythonのlibrosaライブラリが使用できます。以下に簡単なサンプルコードを示します。

import librosa
import numpy as np
import soundfile as sf

# 读取音频文件
audio, sr = librosa.load('input.wav', sr=None)

# 计算短时傅里叶变换(STFT)
stft = librosa.stft(audio)

# 计算音频的能量谱
power = np.abs(stft) ** 2

# 设置阈值(根据实际情况调整)
threshold = np.mean(power) * 0.5

# 将低于阈值的能量谱置为0
mask = power < threshold
power[mask] = 0

# 逆短时傅里叶变换(ISTFT)得到降噪后的音频
denoised_stft = np.sqrt(power) * np.exp(1j * np.angle(stft))
denoised_audio = librosa.istft(denoised_stft)

# 保存降噪后的音频文件
sf.write('output.wav', denoised_audio, sr)

上のコードでは、まずlibrosaライブラリで音源ファイルを読み込み、音源の短時間フーリエ変換(STFT)を計算します。次に、音源のスペクトラムを計算し、閾値より下のスペクトルを0にします。最後に、逆短時間フーリエ変換(iSTFT)を使って、スペクトルを音源信号に戻し、ノイズを軽減した音源ファイルを保存します。最適なノイズ軽減効果を得るには、状況に応じて閾値を調整してください。

bannerAds