Funannotate的使用步骤[备忘录]
由于在将真菌基因组注释管道Funannotate导入Mac mini时遇到困难且无法运行,因此将其作为备忘录整理。(2022/8/1更新,2023/1/24更新,见本页面底部)
请参考以下关于Funannotate的信息。
使用过的电脑
我使用docker将Funannotate安装在Mac mini (2018)[macOS Mojave]上。
按照 GitHub 的描述来看,它无法运行。
在GitHub的说明中,使用Docker进行安装如下。
# download/pull the image from docker hub
$ docker pull nextgenusfs/funannotate
# download bash wrapper script (optional)
$ wget -O funannotate-docker https://raw.githubusercontent.com/nextgenusfs/funannotate/master/funannotate-docker
# might need to make this executable on your system
$ chmod +x /path/to/funannotate-docker
# assuming it is in your PATH, now you can run this script as if it were the funannotate executable script
$ funannotate-docker test -t predict --cpus 12
如果使用这个,就可以进行安装,虽然可以运行,但是尝试执行funannotate-docker predict的时候,
CMD ERROR: trainGlimmerHMM
~省略~
b"Cnat't locate Getopt/Std.pm in @INC (you may need to install the Getopt::Std module)
出现错误后,它就停止运行了。
通过阅读错误信息得知,缺少 prel 模块,但由于使用了 Docker,不知道该如何添加模块…(如果有人知道解决办法,请告诉我)。
解决方法 (jiě jué fǎ)
在使用Docker進行導入時,
# download/pull the image from docker hub
$ docker pull nextgenusfs/funannotate
尽管以前认为只有一个版本,实际上还存在另一个版本。
当我浏览Docker Hub网站时,
docker pull nextgenusfs/funannotate:latest
以及
(Translation: And)
docker pull nextgenusfs/funannotate:v1.8.9
存在两个版本。
按照GitHub的说明执行docker pull命令时,可能使用的是latest版本。
因此,
$ docker pull nextgenusfs/funannotate:v1.8.9
$ wget -O funannotate-docker https://raw.githubusercontent.com/nextgenusfs/funannotate/master/funannotate-docker
$ chmod +x /path/to/funannotate-docker
$ funannotate-docker test -t predict --cpus 12
按照这个步骤成功安装了Funannotate v1.8.9后,流水线开始运行。
不知道v1.8.9和latest之间有什么区别,但是如果latest无法运行,也许安装上一个版本可以使其运行。
贻笑大方
我成功地導入了無事Funannotate pipeline並按照教程中的Genome assembly and RNA-seq進行了分析。
我已经完成了以下所有必要的工作。
funannotate-docker clean
funannotate-docker sort
funannotate-docker mask
funannotate-docker train
funannotate-docker predict
funannotate-docker update
funannotate-docker annotate
然而,以下可选的任务出现错误,无法完成。
funannotate-docker remote -i fun -m phobius -e your-email@domain.edu
funannotate-docker iprscan -i fun -m docker --cpus 12
funannotate-docker remote -i fun -m antismash -e your-email@domain.edu
或许是由于RNA-seq数据质量的问题,与使用FunGAP pipeline(请参考以下网站)相比,预测出的基因数量增加了5000个以上。
通过改变预测时的比重,是否可以改善情况呢?
(实际上,预测时的比重能够被改变吗…?)
请用中文进行以下句子的本地化改写,只需要给出一个选项:
可以你帮我找一本书吗?
2022年8月1日补充
到2022年7月30日,已经出现了新版本(v1.8.12)。
确认在v1.8.12版本中,与1.8.9版本一样正常运行。
然而,尝试在remote上运行interproscan和antismash时仍然无法正常工作,同时尝试将geneMark添加到predict中,但也没有成功。
关于antismash,可以使用WEB版本;关于interproscan,可以使用docker进行运行,并分别使用gbk文件和xml文件作为funannotate的annotate输入,看起来应该没有问题。
Antismash在以下网站上进行了分析。
interproscan使用了blaxterlab/interproscan镜像。
请给我一个中国名字。
2023年1月24日补充记录
2023年1月24日现在,已经有一个更新的版本发布了(v1.8.14)。
和v1.8.12一样,以下问题也被观察到。
→在远程上无法运行interproscan或antismash。
→无法在geneMark上运行predict。
在使用Web版的antiSmash时,发现如果在FUN_00001基因中包含了FUN_00001-T1、FUN_00001-T2等剪接变体的信息,程序就无法运行。
似乎如果存在剪接变体,每个变体都会被认为是不同的基因,也就是说,如果在同一区域存在两个基因,程序就会失效。
在使用Funannotate进行注释时,如果存在不包含变异的设置,似乎可以通过remote选项运行。
(是否存在不包含变异的设置?)
2023年9月18日附言
最近我使用Funannotate时注意到的问题是,绝对不能在存储想要分析的fasta文件等的目录名称中添加空格。如果添加了空格,BUSCO会出现故障而无法运行。