zoukankan      html  css  js  c++  java
  • illumina SNP 芯片转基因型矩阵

    一、芯片数据

    此次拿到的illumina芯片数据并不是原始的数据,已经经过GenomeStudio软件处理成了finalreport文件,格式如下:

    之前没处理过芯片数据,对于这种编码模式(Forward,top AB)的基因型数据很疑惑,查了很多资料,收效甚微。看过建明大神对芯片这块儿的介绍,发现里面的门门道道太多了,也有些R包可以直接处理芯片原始数据的;问题是我没有最初的原始数据啊OTZ。最后找打一个比较靠谱的工具,直接根据finalreport文件和map文件转格式。

    二、工具

    工具:SNPchimpRepo,废话不多说,直接给地址:https://github.com/nicolazzie/SNPchimpRepo ,win,linux,mac三个平台都能用,这里给个赞。map文件要自己构建一个,plink输出的map文件格式就行,这里注意一点,finalreport文件中的SNP Name 一定要包含在map文件中,否则转换的时候会报错。

    三、格式转换

    我的数据比较少,电脑没有安装合适版本的python,直接使用win平台做转换操作。下载软件后解压进入目录SNPConvertGUI_WinMac,解压SNPConvert_WIN64bit.zip,这个就是软件主体,双击直接使用。

    软件界面如下:

    然后加载我们的finalreport文件:

    然后选择我们自己构建的map文件,操作方法同上。然后后面的allele code 可以不用管,选啥输出结果都一样,群体ID可以不填,有默认值,这里我填写的pop1,输出文件前缀,随意填写即可,最后点击 转换按钮等待结果,数据越大耗时越长,不过通常几十秒搞定。

    我的是50k的SNP芯片,106个个体,当然芯片的个体数不可能这么小的,不然达不到起订量的,写这个简易教程用这点数据做示范啦。最后结果也在日志中给出了。拿到ped和map文件后,就可以进行后面的质控和分析啦。

    本文版权归作者和博客园共有,欢迎转载,但未经作者同意必须保留此段声明,且在文章页面明显位置给出原文连接,否则保留追究法律责任的权利.
  • 相关阅读:
    Extjs4 MVC Controller中refs使用
    Mac下下载android4.2源码,进行源码调试
    来博客园一年三个月
    今天写的比较多
    Extjs4 MVC 添加view层
    mac自带vim7配置
    动态测试及调试工具
    等价类划分的延伸
    用javascript进行测试用例的验证
    同行评审在软件测试中的应用
  • 原文地址:https://www.cnblogs.com/mmtinfo/p/12560281.html
Copyright © 2011-2022 走看看