MongoDB データをどのように HDFS にインポートしますか?
次の手順に従って、MongoDB データを HDFS に取り込みます。
- MongoDBのデータをJSONファイルにエクスポート
- MongoDBに付属のmongoexportツールを使えば、MongoDB内のデータをJSONファイルとしてエクスポートできます。たとえば、次のコマンドでmyCollectionコレクションのデータをdata.jsonファイルとしてエクスポートします。
mongoexport –db=myDB –collection=myCollection –out=data.json - JSONファイルをHDFSにアップロードする。
- Hadoopのhdfsコマンドを使用すると、ローカルファイルをHDFSにアップロードできます。たとえば、次のコマンドを使用してdata.jsonファイルをHDFSの/dataディレクトリにアップロードします。hdfs dfs -put data.json /data/
- HDFS に正常に取り込まれたことを確認します。
- HDFSへアップロードしたファイルの閲覧にはhdfs dfs -lsコマンドを利用する。例えば、以下のコマンドは/dataディレクトリ内のファイル一覧表示を行う。
hdfs dfs -ls /data/
上記の手順が行われれば、MongoDB内のデータをHDFS内に問題なく取り込むことができます。