MongoDB データをどのように HDFS にインポートしますか?

次の手順に従って、MongoDB データを HDFS に取り込みます。

  1. MongoDBのデータをJSONファイルにエクスポート
  2. MongoDBに付属のmongoexportツールを使えば、MongoDB内のデータをJSONファイルとしてエクスポートできます。たとえば、次のコマンドでmyCollectionコレクションのデータをdata.jsonファイルとしてエクスポートします。
    mongoexport –db=myDB –collection=myCollection –out=data.json
  3. JSONファイルをHDFSにアップロードする。
  4. Hadoopのhdfsコマンドを使用すると、ローカルファイルをHDFSにアップロードできます。たとえば、次のコマンドを使用してdata.jsonファイルをHDFSの/dataディレクトリにアップロードします。hdfs dfs -put data.json /data/
  5. HDFS に正常に取り込まれたことを確認します。
  6. HDFSへアップロードしたファイルの閲覧にはhdfs dfs -lsコマンドを利用する。例えば、以下のコマンドは/dataディレクトリ内のファイル一覧表示を行う。
    hdfs dfs -ls /data/

上記の手順が行われれば、MongoDB内のデータをHDFS内に問題なく取り込むことができます。

bannerAds