必备软件
Aspera 插件 下载网址 :https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi
每个过程对应的网址:
NCBI注册 网址:https://www.ncbi.nlm.nih.gov/account/
申请BioProject 网址:https://submit.ncbi.nlm.nih.gov/subs/bioproject/
申请BioSample 网址:https://submit.ncbi.nlm.nih.gov/subs/biosample/
上传SRA 网址:https://www.ncbi.nlm.nih.gov/Traces/sra_sub/sub.cgi
数据整体上传的流程图如下:
1. 注册NCBI
打开 NCBI,点击右上角的“Log in”,如下图:
很多同学现在打开NCBI想注册/登录的时候,会发现如下提示:强制性使用第三方进行注册/登录。
2 创建Bio-Project
01.
输入BioProject网址,先进行个人信息完善,以便成功申请到 Bio-Project。点击“My profile”完善个人信息后并点击“Save”,即可完成填写。
02
点击 BioProject,再点击 New submission,进入BioProject 的信息填写页面,按照步骤进行填写。
A
Submitter界面直接点击continue;
B
Project Type 界面,选择 Raw sequence reads,有组装数据的也选择 Genome sequencing and assembly;Sample scope 有 5 类选择:单一样本,多个样本,多物种,环境样本,合成样本等,可按照实际点击,其中普通转录组选择:Multiisolate;微生物多样性或宏基因选择Environment;
C
Target 界面,只需填写研究物种拉丁文名即可;
D
General Info 界面,选择数据释放日期(可以立马释放,也可指定日期),Public description 部分对自己的研究简要描述即可
E
BIOSAMPLE、PUBLICATIONS 界面可直接跳过,最后点击 Submit,等待 NCBI 审核通过,即可完成 Bio-Project 的创建。
3
创建Bio-Sample
01
输入BioSample网址,点击 New submission,即出现 BioSample 界面,如下:
02
Submitter界面直接点击Continue;
03
General Information 界面,选择数据释放日期和样本个数,点击 Continue;
如上传表格数据,以下载Excel表格为例进行操作:
这里需要注意一下表头的颜色,其中绿色为必填项,蓝色为选填项,黄色为非填项。如果绿色的任何必填字段的信息不可用,可输入“not collected”、“not applicable”或“missing”替代。蓝色虽为选填项,但至少填写一个,同样出现何必填字段的信息不可用,请输入“not collected”、“not applicable”或“missing”替代。黄色可以不予填写。每一个单元格填写是有格式要求的,可以点击需要填写的列名查看具体格式!
06
BioSample accession:注册好的Biosample编号直接填写;
Library ID:它是唯一的,我们可以使用物种拉丁文名命名。
Library strategy可以选择WGS,Library source可以选择Genomic,Library selection可以选择size fractionation,Library layout可以选择paired,Platform可以选择illumina,instrument model可以选择Illumina NovaSeq 6000;
Filetype可以选择fastq;后面的Filename 可依次填写M_sinensis_A_illumina_R1.fastq.gz、M_sinensis_A_illumina_R2.fastq.gz等,填写完毕后点击Continue。
D
Files界面:数据上传的选择方式,若单个文件数据量小于10G,样本数小于300个,我们推荐Aspera方式上传(如下图);
然后我们点击choose files,选择相应的桌面文件,如下:
注意事项:
(1)所有样本的原始数据需放在同一目录下;
(2)原始数据为 fastq 格式的压缩文件;
(3)若为双端测序,需要提供双端的原始数据,即 R1 端和 R2 端。
接着会显示上传界面,网页版显示如下:
Aspera软件界面显示如下:
03
待所有数据上传成功后,我们就可以进入确认界面,点击submit,即SRA数据上传完成,我们只需等待NCBI审核通过,就可获得对应样本的SRA编号。