zoukankan      html  css  js  c++  java
  • illumina SNP 芯片转基因型矩阵

    一、芯片数据

    此次拿到的illumina芯片数据并不是原始的数据,已经经过GenomeStudio软件处理成了finalreport文件,格式如下:

    之前没处理过芯片数据,对于这种编码模式(Forward,top AB)的基因型数据很疑惑,查了很多资料,收效甚微。看过建明大神对芯片这块儿的介绍,发现里面的门门道道太多了,也有些R包可以直接处理芯片原始数据的;问题是我没有最初的原始数据啊OTZ。最后找打一个比较靠谱的工具,直接根据finalreport文件和map文件转格式。

    二、工具

    工具:SNPchimpRepo,废话不多说,直接给地址:https://github.com/nicolazzie/SNPchimpRepo ,win,linux,mac三个平台都能用,这里给个赞。map文件要自己构建一个,plink输出的map文件格式就行,这里注意一点,finalreport文件中的SNP Name 一定要包含在map文件中,否则转换的时候会报错。

    三、格式转换

    我的数据比较少,电脑没有安装合适版本的python,直接使用win平台做转换操作。下载软件后解压进入目录SNPConvertGUI_WinMac,解压SNPConvert_WIN64bit.zip,这个就是软件主体,双击直接使用。

    软件界面如下:

    然后加载我们的finalreport文件:

    然后选择我们自己构建的map文件,操作方法同上。然后后面的allele code 可以不用管,选啥输出结果都一样,群体ID可以不填,有默认值,这里我填写的pop1,输出文件前缀,随意填写即可,最后点击 转换按钮等待结果,数据越大耗时越长,不过通常几十秒搞定。

    我的是50k的SNP芯片,106个个体,当然芯片的个体数不可能这么小的,不然达不到起订量的,写这个简易教程用这点数据做示范啦。最后结果也在日志中给出了。拿到ped和map文件后,就可以进行后面的质控和分析啦。

    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
  • 相关阅读:
    断行
    椭圆曲线质因数分解2
    sqrti128
    HLPP
    Optimize Prime Sieve
    python 一些乱七八糟的东西
    移动机器人建图与导航代码实现——3.Path Tracking
    移动机器人建图与导航代码实现——2.Path Planning
    移动机器人建图与导航代码实现——1.Hector SLAM
    移动机器人建图与导航代码实现——0.目录
  • 原文地址:https://www.cnblogs.com/mmtinfo/p/12560281.html
Copyright © 2011-2022 走看看