Pythonのマルチスレッドを使用してデータを並列処理する方法

2年 ago

海斗, 葵

1 minute

Pythonでは、threadingモジュールでマルチスレッドによる並列データ処理が可能です。以下は簡単な例です。

import threading

def process_data(data):
    # 处理数据的逻辑
    pass

def main():
    # 假设有一些数据需要处理
    data = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

    # 创建线程列表
    threads = []

    # 创建并启动线程
    for item in data:
        thread = threading.Thread(target=process_data, args=(item,))
        thread.start()
        threads.append(thread)

    # 等待所有线程完成
    for thread in threads:
        thread.join()

    print("所有数据处理完成！")

if __name__ == "__main__":
    main()

上のサンプルで、process_data関数はデータの処理を行うロジックになっており、各自のニーズに合わせて書き直してください。main関数では、まず、処理するデータを定義し、スレッドのリストthreadsを作成し、threading.Threadクラスを用いて複数のスレッドを生成し、スレッドリストに追加しています。その後、startメソッドを呼び出して、スレッドをスタートさせています。最後に、joinメソッドで全ての処理が終わるまで待ってから、データ処理完了の旨を表示しています。

なお、マルチスレッドによるデータの並行処理では、共有データへのアクセス制御など、スレッドセーフティに関する課題が発生する可能性があります。実際のアプリケーションでは、どういった問題が発生するのかを検討し、解決する必要があります。