NCBI数据下载的几种方法

bat365官方网站 📅 2025-10-08 04:17:47 👤 admin 👁️ 5969 ❤️ 372
NCBI数据下载的几种方法

这一篇记录一下NCBI/Genbank数据库中批量下载数据的几种方法:

1、迅雷

将所有序列的下载链接整理在一起后在迅雷中创建下载,可以批量进行序列下载

注:不知道是电脑还是网络问题,有时候下载的超慢甚至连接不上

2、TBtools

首先准备好需要下载的序列号,将其放入一个text文件中

打开TBtools软件,点击Sequence Toolkit

点击Start,等待下载即可

3、利用Biopython下载

##一条一条地下载基因序列

from Bio import Entrez,SeqIO

Entrez.email = "用户邮箱"

ids='序列的ID号'

hd_efetch_fa = Entrez.efetch(db='nucleotide', id=ids, rettype="fasta")

read_efetch_fa = hd_efetch_fa.read()

with open('保存数据的文件',"w") as file:

file.write(read_efetch_fa)

print(' finished!')

##批量下载序列,序列号存放在download.txt文件中,下载下来的序列分别写入以1为起始名的fasta文件中

from Bio import Entrez,SeqIO

file_in_name="download.txt"

Entrez.email = '你的邮箱'

input_file=open(file_in_name,"r")

i=0

for record_id in input_file:##一行一行读取序列的ID号

hd_efetch_fa = Entrez.efetch(db='nucleotide', id=record_id, rettype="fasta")

read_efetch_fa = hd_efetch_fa.read()

i=i+1

with open(str(i)+'.fasta'', "w") as file:##将下载的序列顺序存放在以i=1为起始名的文件中

file.write(read_efetch_fa)

print('finished!')##每当一个序列下载完成就打印一次finished!

ok,静待后续继续补充

相关养生推荐

绩效考核中的KPI是什么意思?
365bet体育手机

绩效考核中的KPI是什么意思?

📅 09-28 👁️ 1875
如何查论文重复率:从基本概念到实现方法
365bet体育手机

如何查论文重复率:从基本概念到实现方法

📅 08-03 👁️ 1069
雇佣兵(PET)指南-装备选择 - 【暗黑破坏神2人物】
bat365官方网站

雇佣兵(PET)指南-装备选择 - 【暗黑破坏神2人物】

📅 07-06 👁️ 9541
茆怎么读姓氏(茆姓一般是什么民族)
365bet体育手机

茆怎么读姓氏(茆姓一般是什么民族)

📅 08-20 👁️ 5007
科普一下:实用新型发明专利有没有含金量?
亚洲365bet比分

科普一下:实用新型发明专利有没有含金量?

📅 09-27 👁️ 3909
廪增的解释及意思
365bet体育手机

廪增的解释及意思

📅 09-05 👁️ 9538