PHP で Word 文書のコンテンツを読み取る

PHPWordなどのPHP用サードパーティライブラリを使用すると、Word文書のコンテンツを読み取ることができます。

まず、PHPWordライブラリのインストールが必要です。Composerからインストールできます。次のコマンドを実行します。

composer require phpoffice/phpword

インストール後、次のコードを使用して Word 文書の内容を読み取ることができます:

require 'vendor/autoload.php';

// 载入Word文档
$phpWord = \PhpOffice\PhpWord\IOFactory::load('path/to/word/document.docx');

// 获取文档的所有段落
$paragraphs = $phpWord->getSections()[0]->getElements();

// 遍历每个段落,并输出其内容
foreach ($paragraphs as $paragraph) {
    echo $paragraph->getText() . "<br>";
}

このコードは、まずloadメソッドでWord文書を読み込みます。その後、getSections()メソッドで文書のすべてのセクションを取得し、getElements()メソッドでセクションのすべての要素(段落、表など)を取得します。次に、各段落を繰り返し処理して、getText()メソッドで段落のテキスト内容を取得します。

Word文書に表や画像などの要素が含まれている場合は、状況に応じて処理する必要があることに注意してください。具体的な処理方法はPHPWordの公式ドキュメントを参照してください。

bannerAds