MongoDBにデータをバッチインポートする方法は何ですか?
MongoDB にはデータをバッチでインポートするための複数の方法がありますが、一般的な方法は次の 2 つです。
1. mongoimportコマンドラインツールを使用する
mongoimportはMongoDBが提供するコマンドラインツールで、さまざまな形式のファイルからMongoDBデータベースにデータをインポートできます。インポート可能なファイル形式には、CSV、JSON、BSONなどがあります。
以下は mongoimportコマンドを使用してCSVファイルをインポートする例です。
mongoimport --host --port --db --collection --type csv --file --headerline
ここで、“を MongoDB サーバーのホスト名、“を MongoDB サーバーのポート番号、“を対象データベース名、“を対象コレクション名、“をインポート元の CSV ファイル名に置き換える必要があります。
2. MongoDB ドライバーの使用
もう1つの大量インポート方法は、MongoDBの公式ドライバ(PythonならPyMongoなど)を利用する方法だ。スクリプトやアプリケーションを作成することで、ドライバを使用してMongoDBデータベースに接続し、提供されるAPIを活用して、データをコレクションに一括挿入することができる。
PyMongo ドライバを使用してバッチでデータをインポートする例を次に示します。
from pymongo import MongoClient
import json
# 连接到MongoDB数据库
client = MongoClient('mongodb://localhost:27017')
# 选择目标数据库和集合
db = client['mydatabase']
collection = db['mycollection']
# 读取数据文件
with open('data.json') as file:
data = json.load(file)
# 批量插入数据
collection.insert_many(data)
この例で、`localhost:27017`をMongoDBサーバーのホストとポート番号、`mydatabase`を対象データベースの名前、`mycollection`を対象コレクションの名前に置き換え、`data.json`をインポートするJSONファイル名に置き換える必要があります。
一般的に広く使われているデータ一括インポートの手法は 2 種類あります。どちらを選択するかはニーズと好みによって異なります。