Funannotate的使用步骤[备忘录]

由于在将真菌基因组注释管道Funannotate导入Mac mini时遇到困难且无法运行,因此将其作为备忘录整理。(2022/8/1更新,2023/1/24更新,见本页面底部)

请参考以下关于Funannotate的信息。

 

使用过的电脑

我使用docker将Funannotate安装在Mac mini (2018)[macOS Mojave]上。

按照 GitHub 的描述来看,它无法运行。

在GitHub的说明中,使用Docker进行安装如下。

# download/pull the image from docker hub
$ docker pull nextgenusfs/funannotate

# download bash wrapper script (optional)
$ wget -O funannotate-docker https://raw.githubusercontent.com/nextgenusfs/funannotate/master/funannotate-docker

# might need to make this executable on your system
$ chmod +x /path/to/funannotate-docker

# assuming it is in your PATH, now you can run this script as if it were the funannotate executable script
$ funannotate-docker test -t predict --cpus 12

如果使用这个,就可以进行安装,虽然可以运行,但是尝试执行funannotate-docker predict的时候,

CMD ERROR: trainGlimmerHMM

~省略~

b"Cnat't locate Getopt/Std.pm in @INC (you may need to install the Getopt::Std module)

出现错误后,它就停止运行了。
通过阅读错误信息得知,缺少 prel 模块,但由于使用了 Docker,不知道该如何添加模块…(如果有人知道解决办法,请告诉我)。

解决方法 (jiě jué fǎ)

在使用Docker進行導入時,

# download/pull the image from docker hub
$ docker pull nextgenusfs/funannotate

尽管以前认为只有一个版本,实际上还存在另一个版本。

 

当我浏览Docker Hub网站时,

docker pull nextgenusfs/funannotate:latest

以及
(Translation: And)

docker pull nextgenusfs/funannotate:v1.8.9

存在两个版本。
按照GitHub的说明执行docker pull命令时,可能使用的是latest版本。

因此,

$ docker pull nextgenusfs/funannotate:v1.8.9

$ wget -O funannotate-docker https://raw.githubusercontent.com/nextgenusfs/funannotate/master/funannotate-docker

$ chmod +x /path/to/funannotate-docker

$ funannotate-docker test -t predict --cpus 12

按照这个步骤成功安装了Funannotate v1.8.9后,流水线开始运行。
不知道v1.8.9和latest之间有什么区别,但是如果latest无法运行,也许安装上一个版本可以使其运行。

贻笑大方

我成功地導入了無事Funannotate pipeline並按照教程中的Genome assembly and RNA-seq進行了分析。

 

我已经完成了以下所有必要的工作。

funannotate-docker clean
funannotate-docker sort
funannotate-docker mask
funannotate-docker train
funannotate-docker predict
funannotate-docker update
funannotate-docker annotate

然而,以下可选的任务出现错误,无法完成。

funannotate-docker remote -i fun -m phobius -e your-email@domain.edu
funannotate-docker iprscan -i fun -m docker --cpus 12
funannotate-docker remote -i fun -m antismash -e your-email@domain.edu

或许是由于RNA-seq数据质量的问题,与使用FunGAP pipeline(请参考以下网站)相比,预测出的基因数量增加了5000个以上。
通过改变预测时的比重,是否可以改善情况呢?
(实际上,预测时的比重能够被改变吗…?)

 

请用中文进行以下句子的本地化改写,只需要给出一个选项:

可以你帮我找一本书吗?

2022年8月1日补充

到2022年7月30日,已经出现了新版本(v1.8.12)。

 

确认在v1.8.12版本中,与1.8.9版本一样正常运行。
然而,尝试在remote上运行interproscan和antismash时仍然无法正常工作,同时尝试将geneMark添加到predict中,但也没有成功。

关于antismash,可以使用WEB版本;关于interproscan,可以使用docker进行运行,并分别使用gbk文件和xml文件作为funannotate的annotate输入,看起来应该没有问题。

Antismash在以下网站上进行了分析。

 

interproscan使用了blaxterlab/interproscan镜像。

 

请给我一个中国名字。

2023年1月24日补充记录

2023年1月24日现在,已经有一个更新的版本发布了(v1.8.14)。

 

和v1.8.12一样,以下问题也被观察到。
→在远程上无法运行interproscan或antismash。
→无法在geneMark上运行predict。

在使用Web版的antiSmash时,发现如果在FUN_00001基因中包含了FUN_00001-T1、FUN_00001-T2等剪接变体的信息,程序就无法运行。
似乎如果存在剪接变体,每个变体都会被认为是不同的基因,也就是说,如果在同一区域存在两个基因,程序就会失效。

在使用Funannotate进行注释时,如果存在不包含变异的设置,似乎可以通过remote选项运行。
(是否存在不包含变异的设置?)

2023年9月18日附言

最近我使用Funannotate时注意到的问题是,绝对不能在存储想要分析的fasta文件等的目录名称中添加空格。如果添加了空格,BUSCO会出现故障而无法运行。

bannerAds