PHP で Word 文書のコンテンツを読み取る
PHPWordなどのPHP用サードパーティライブラリを使用すると、Word文書のコンテンツを読み取ることができます。
まず、PHPWordライブラリのインストールが必要です。Composerからインストールできます。次のコマンドを実行します。
composer require phpoffice/phpword
インストール後、次のコードを使用して Word 文書の内容を読み取ることができます:
require 'vendor/autoload.php';
// 载入Word文档
$phpWord = \PhpOffice\PhpWord\IOFactory::load('path/to/word/document.docx');
// 获取文档的所有段落
$paragraphs = $phpWord->getSections()[0]->getElements();
// 遍历每个段落,并输出其内容
foreach ($paragraphs as $paragraph) {
echo $paragraph->getText() . "<br>";
}
このコードは、まずloadメソッドでWord文書を読み込みます。その後、getSections()メソッドで文書のすべてのセクションを取得し、getElements()メソッドでセクションのすべての要素(段落、表など)を取得します。次に、各段落を繰り返し処理して、getText()メソッドで段落のテキスト内容を取得します。
Word文書に表や画像などの要素が含まれている場合は、状況に応じて処理する必要があることに注意してください。具体的な処理方法はPHPWordの公式ドキュメントを参照してください。