使用Docker将PDF转为文本。 Docker(16)

进行各种任务时使用Docker,并将其上传到Docker Hub上。

    1. 在工作场所和出差地点并不一定能使用相同的设备进行工作。

 

    1. 设备的搬运很辛苦。每周有一天是无需携带设备的休息日。

 

    1. 所有的设备都可以使用git和docker。

 

    1. 在Windows、mac OS、Linux、Raspberry PI(Rasbian)上进行相同的操作以确保一致性。

 

    1. 如果有人能帮忙的话,希望能得到帮助。

 

    1. 只使用在Web上发布的内容(如GitHub等)进行工作。

 

    1. 操作步骤等会在Qiita、researchmap等地方进行记录。

 

    将docker hub的下载目标设置为总共1000。当前(892)。

docker(4)docker hub 和Qiita
https://qiita.com/kaizen_nagoya/items/798358bba382d693e391

docker(4)docker hub和Qiita

每次都在不同的地方遇到阻碍。

# apt install pdftotext
Reading package lists... Done
Building dependency tree       
Reading state information... Done
E: Unable to locate package pdftotext

嗯,pdftotext不可以通过apt安装吗?

不不不是这样的。

$ docker run -v /Users/administrator/Downloads/nakamori:/home/nakamori -it ubuntu /bin/bash

我想把 macOS 文件夹中的 PDF 文件进行转换。
通过文件共享启动 Ubuntu。

听说pdftotext在poppler-utils里面。

# apt update; apt -y upgrade
# apt install -y poppler-utils vim

在macOS和Windows上共享文件时,不知不觉中会混入一些在ubuntu命令行无法读取的字符编码。

# apt -y install nkf
# nkf -w qc-nishimori.txt >qc-nishimori-u.csv

请参考资料。

在arXiv上发表了关于使用Docker创建量子计算机论文词汇表的西森秀稔。

文书历史

このエントリーをはてなブックマークに追加

文件历程

版本0.01 草稿 20190622
版本0.04 地址附加 20230308

非常感谢您阅读到最后。

喜欢的话,请关注我。

非常感谢您阅读到最后一句话。

请点击喜欢的图标 ?并关注我,享受快乐的生活。

bannerAds