blast命令

it2024-05-13 147

蛋白质序列比对蛋白质数据库（blastp） blastp -query seq.fast -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_des criptions 10 -num_threads 8

核酸序列比对核算数据库（blastn） blastn -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

核酸序列比对蛋白质数据库（blastx） blastx -query seq.fasta -out seq.blast -db dbname -outfmt 6 -evalue 1e-5 -num_descriptions 10 -num_threads 8

参数： -query：输入文件路径及文件名 -out：输出文件路径及文件名 -db：格式化了的数据库路径及数据库名 -outfmt：输出文件格式，总共有12种格式，6是tabular格式对应BLAST的m8格式 -evalue：设置输出结果的e-value值 -num_descriptions：tabular格式输出结果的条数 -num_threads：线程数

创建索引数据库 makeblastdb -in mouse.faa -dbtype nucl -input_type fasta -out dna

参数： -in: 输入数据库文件 -dbtype:数据库类型如果是蛋白质数据库则 nucl改为 prot -out: 索引数据库名称

创建索引文件 dustmasker -in Nuc.fasta -infmt fasta -parse_seqids -outfmt maskinfo_asn1_bin -out Nuc_all.asnb 参数： in:输入数据库文件 -infmt:输入文件的格式 -parse_seqids:解析序列的id，这个只需要提供参数，不要提供文件名 -outfmt:输出文件的格式，直接填写即可maskinfo_asnl_bin即可。 out：输出文件的文件名（索引文件名）。

创建数据库 makeblastdb -in Nuc.fasta -input_type fasta -dbtype nucl -parse_seqids -mask_data NucDatsBase.asnb -out Nuc_all 参数： in:原本我们数据库的文件 input_type:输入文件的格式，很明显，我这里是fasta格式

最新回复(0)