pythonでどうやって音声ノイズ除去を行うか

2年 ago

優斗, 朝陽

1 minute

音声のノイズ除去には、Pythonのlibrosaライブラリが使用できます。以下に簡単なサンプルコードを示します。

import librosa
import numpy as np
import soundfile as sf

# 读取音频文件
audio, sr = librosa.load('input.wav', sr=None)

# 计算短时傅里叶变换（STFT）
stft = librosa.stft(audio)

# 计算音频的能量谱
power = np.abs(stft) ** 2

# 设置阈值（根据实际情况调整）
threshold = np.mean(power) * 0.5

# 将低于阈值的能量谱置为0
mask = power < threshold
power[mask] = 0

# 逆短时傅里叶变换（ISTFT）得到降噪后的音频
denoised_stft = np.sqrt(power) * np.exp(1j * np.angle(stft))
denoised_audio = librosa.istft(denoised_stft)

# 保存降噪后的音频文件
sf.write('output.wav', denoised_audio, sr)

上のコードでは、まずlibrosaライブラリで音源ファイルを読み込み、音源の短時間フーリエ変換（STFT）を計算します。次に、音源のスペクトラムを計算し、閾値より下のスペクトルを0にします。最後に、逆短時間フーリエ変換（iSTFT）を使って、スペクトルを音源信号に戻し、ノイズを軽減した音源ファイルを保存します。最適なノイズ軽減効果を得るには、状況に応じて閾値を調整してください。