zoukankan      html  css  js  c++  java
  • Aspera下载安装使用

    Aspera

    Linux

    安装

    conda 安装

    在Linux上安装Aspera,方便的还是直接通过conda进行安装(已经安装了Anaconda),在需要安装的环境下输入以下命令进行安装:

    $ conda install -c hcc aspera-cli -y
    

    查看是否安装成功

    # 有输出帮助文档则安装成功
    $ ascp -h
    

    查找密钥(下面使用会用到)

    $ which ascp # 输出下面内容,不同环境不一样,根据自己的来
    ~/software/miniconda3/envs/test/bin/ascp
    

    binbin后面的内容换成etc/asperaweb_id_dsa.openssh
    可以用ls验证一下是否存在。

    $ ls ~/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh
    /home/wwwdj/software/miniconda3/envs/test/etc/asperaweb_id_dsa.openssh
    

    自己安装

    (conda 安装好了可以跳过了~)
    若是要自己去官网下载软件来安装的话,这是下载命令,链接:

    https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
    

    上面命令里的下载链接是当前最新版本3.11的,这篇文章发布后,可能会出现新版本。若需要可去官网下载。
    下面这个链接包含了各个平台的软件包,不过可能需要注册账号登录才能获取下载链接。

    https://www.ibm.com/support/fixcentral/swg/selectFixes?parent=ibm~Other%20software&product=ibm/Other+software/IBM+Aspera+Connect&release=All&platform=All&function=all
    

    以上面那个3.11版本的为例。
    下载

    $ wget https://ak-delivery04-mul.dhe.ibm.com/sar/CMA/OSA/09cne/0/ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
    

    解压

    $ tar -zxvf ibm-aspera-connect-3.11.0.5-linux-g2.12-64.tar.gz
    

    安装

    ## sh文件上一步解压生成的
    $ ./ibm-aspera-connect-3.11.0.5-linux-g2.12-64.sh
    

    设置环境变量

    # 把USERNAME 换成自己的linux 账户名
    $ echo """export PATH="/home/USERNAME/.aspera/connect/bin:$PATH" """ >> ~/.bashrc
    

    使之立即生效

    $ source ~/.bashrc
    

    查看是否安装成功

    # 有输出帮助文档则安装成功
    $ ascp -h
    

    基本语法

    基本语法如下,[OPTION] 是参数设置,SRC 是远程资源路径,DEST是文件保存路径。若SRC为多个文件,则保存在DEST目录下。

    ascp [OPTION] SRC... DEST
    

    以一个例子作为说明

    $ ascp  -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz ./test.fq.gz
    
    参数 说明
    -l 最大传输速率
    -i 密钥地址,自己安装都是:~/.aspera/connect/etc/asperaweb_id_dsa.openssh ,conda安装参照上面内容
    -P -P33001,分开合起作用都是一样。设成其他可能会要输密码。Set the TCP port used for fasp session initiation. (Default: 22)
    -Q Enable fair transfer policy
    -k -k2, 分开合起作用都是一样,异常中断可以重启。Enables fatal transfer restarts.
    -T 禁止加密。Disable encryption for maximum throughput.
    SRC 位置参数,源文件地址,类似era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/004/SRR5760814/SRR5760814.fastq.gz
    DEST ./test.fq.gz, 保存地址

    参数啥的,我也没整明白。上面参数及说明参考ebi官网 https://www.ebi.ac.uk/ega/about/ftp-aspera,
    更多的参数设置参考 https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html

    EBI数据下载

    之前aspera是可以下载DDBJ,EBI,NCBI三大数据库的数据的。不过现在,由于NCBI数据迁移至云服务器了,可能不太好使了。DDBJ也是可以的,但不是国内似乎用ddbj的人不怎么用,不过它也不太好用。
    三大数据库,若使用apera下载数据的话,现在应是ebi的最好使,它也直接给了apera下载地址。

    下面以PRJNA392105(SRP110599 )项目数据为例,演示下载。

    ebi 的更直观一些,直接打开网址,输入框输入Accession号就能很容易查到数据了,然后相关信息也很全,下载链接直接就给了。
    浏览器输入以下url就可以跳到相应页面(手动在ebi官网输入框输入PRJNA392105查询也可以~)

    https://www.ebi.ac.uk/ena/browser/view/PRJNA392105
    

    打开页面后,把网页往下滑一下能看到一下页面(可能刚打开,还没加载完,得等一会儿才能看到)点Download All可以把所有样本的信息给下载了。方便用于批量下载。
    image.png

    滑动下面的滑动条,能看到FASTQ Aspera,这就是aspera下载链接。若没有看到,可点击右上角的倒三角图样,把fastq_aspera勾选了。其他的信息按自己要求也可以勾选。
    image.png

    这里就以单个文件为例演示下载。
    这是上面图片看到第一个aspera下载链接。

    # :前为服务器地址,:后为资源地址
    fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz
    

    构建下载命令时,需要在下载链接前加上ebi 给的公共账户名era-fasp(好像是)
    如下:

    $ ascp -l 100M -P 33001 -QT -k 2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz
    

    取别名

    上面的命名,有些参数,基本每次都不会变动的。而每次都要输一遍,又很麻烦,因此可以用alias固定几个参数,取一个别名。

    运行以下命令

    $ echo "alias ascpp="ascp -QT -P33001 -k2 -i ~/.aspera/connect/etc/asperaweb_id_dsa.openssh"" >> ~/.bashrc
    $ source ~/.bashrc
    

    以上命令,利用alias 给ascp添加了几个参数(可自行设定,这里因为-l 可能会经常变动,没加上它),赋给了新的命令 ascpp,原来的ascp也是可以用的。
    再次下载数据,命令就简短许多了:

    $ ascpp -l 100M era-fasp@fasp.sra.ebi.ac.uk:/vol1/fastq/SRR576/002/SRR5760812/SRR5760812.fastq.gz ./test.fq.gz
    test.fq.gz                                                                                                            100% 1066MB 97.2Mb/s    03:57    
    Completed: 1092464K bytes transferred in 237 seconds
     (37695K bits/sec), in 1 file.
    
    

    DDBJ数据下载

    DDBJ虽然不太好用,而且现在也没有提供fastq下载地址,不过可能也有人需要下载,这里简单说一下。
    下面是一个下载测试
    image.png
    看起来下载速度还不错吧。

    还是以上面的PRJNA392105(SRP110599 )为例,打开ddbj数据查询网页

    https://ddbj.nig.ac.jp/DRASearch/
    

    image.png
    在页面 Accession后输入SRP110599,输入PRJNA392105查询不到的。
    返回页面如下
    image.png

    然后,按图点击操作(仅做演示,随意下载。)
    image.png

    得到链接后类似这样

    ftp://ftp.ddbj.nig.ac.jp/ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra
    

    链接改一下变成下面这样

    anonftp@ascp.ddbj.nig.ac.jp:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra
    

    下载命令为:

    $ ascpp -l 1000M anonftp@ascp.ddbj.nig.ac.jp:ddbj_database/dra/sralite/ByExp/litesra/SRX/SRX296/SRX2960632/SRR5760812/SRR5760812.sra ./test.sra
    

    参考

    https://www.ebi.ac.uk/ega/about/ftp-aspera
    https://download.asperasoft.com/download/docs/ascp/2.7/html/index.html

    ps: 欢迎关注

  • 相关阅读:
    常用cmd命令总结
    百度地图api的简单应用(二):轻量级路径规划
    百度地图api的简单应用(一):POI检索
    R语言-八皇后问题
    8086基本IO口的仿真
    输入输出与中断
    汇编语言例子
    变量标号
    变量声明
    串操作指令2
  • 原文地址:https://www.cnblogs.com/huanping/p/14308007.html
Copyright © 2011-2022 走看看