相关文章
基因型数据绘制PCA图和聚类分析图
2024-11-10 17:06

用PCA做为GWAS的协变量,相当于将品种结构考虑进去。它类似将不同品种作为协变量,或者将群体结构矩阵Q作为协变量。

基因型数据绘制PCA图和聚类分析图

下面看一下利用基因型SNP数据进行PCA计算,以及可视化的分析。

很多软件可以分析PCA,这里介绍一下使用plink软件和R语言,进行PCA分析,并且使用ggplot2绘制2D和3D的PCA图。

绘制后的图如下:

2-D PCA图:

图片解释,将每个品种用不同的颜色表示,同时绘制置信区间圆圈,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。

3-D PCA图:

图片解释,将每个品种用不同的颜色表示,X坐标是PC1,解释24.9%的变异,Y坐标是PC2,解释10.61%的变异,Z坐标是PC3,解释1.02%的变异。可以看到,三个品种在PCA图里面分的比较开,C品种的有两个A和B的点,应该是异常数据。

基因型数据:

共有3个品种A,B,C,共有412个个体。其中:

SNP个数为:41013

计算思路:

1,对数据进行清洗,将其转化为0,1,2的形式

2,计算G矩阵

3,计算PCA的特征向量和特征值

4,根据特征值计算解释百分比

5,根据特征向量和品种标签,进行PCA的绘制

绘制代码如下:

首先,使用plink命令,将基因型数据转化为012的raw格式:

结果生成plink.raw文件。

然后使用R语言,计算PCA,并绘制PCA图。

聚类分析思路:

1,计算个体的亲缘关系矩阵G矩阵

2,因为数据太多,随机选择100个,用于聚类

默认的作图,太挤。

画圈图:

可以看到,A,B,C三个品种,可以分开,分得很开。

    以上就是本篇文章【基因型数据绘制PCA图和聚类分析图】的全部内容了,欢迎阅览 ! 文章地址:http://yybeili.xhstdz.com/news/1543.html 
     栏目首页      相关文章      动态      同类文章      热门文章      网站地图      返回首页 物流园资讯移动站 http://yybeili.xhstdz.com/mobile/ , 查看更多   
最新文章
chatai对于某些问题的理解
当政府在处理问题的方法上排斥问题提出者,倾向于掩盖问题时,政府的外观可能会发生以下变化:缺乏民主与开放:政府与民众之间的
2024工博会首日,汇川数自融合新质动力革新
数自融合的新质动力2024年工博会首日,汇川展台盛况依旧。数自融合,深度尽显。开启了一场工业变革的非凡盛宴——■ 数字工厂软
AI绘画如何从入门到精通?保姆级教程来啦
在数字化飞速发展的今天,AI绘画已经成为一种新颖且富有创造力的艺术形式。对于初学者来说,想要掌握AI绘画可能会觉
GEM5 Garnet Standalone packet injection pattern garnet包的生成路径:packet message flit
/ 在不同的消息类别上对不同的一致性消息类型进行建模。 // // GarnetSyntheticTraffic 采用 Garnet_standalone 一致性协议 //
AI心理服务机器人:帮人们自助解决心理问题
  北京大学第六医院临床心理中心研发的AI心理服务机器人“北小六”。实习生 王婧/摄   最近半年,00后女孩周美宜逐渐感觉身
CopyCopter
CopyCopter AI是一款由 Eleven Labs 开发的AI-powered Text-to-Video Generation Tool。这款工具的核心功能是将长篇的书面内容转
AI人工智能原理与Python实战:Python数据可视化
人工智能(Artificial Intelligence, AI)和数据可视化(Data Visualization)都是当今最热门的技术领域之一。人工智能是一种使计算
AI对创作者的威胁,以另一种方式实现
本文来自微信公众号:虹线(ID:gh_900eeca5a2fc),作者:评论尸,原文标题:《鼠巢,AIGC,可颂猫,短视频》,题图来自:视觉
AI智能领域哪家强?揭秘最佳品牌排行榜!
AI智能领域哪家强?揭秘最佳品牌排行榜!在当今科技飞速发展的时代,人工智能(AI)已经成为了一个备受关注的热点领域。随着AI技
ai写作神器有哪些?ai人工智能对话软件有哪些?
AI写作神器有哪些?ai人工智能对话软件有哪些?随着人工智能技术的不断发展,越来越多的工具开始利用AI技术来辅助人类完成各种任
相关文章