主页 > 最新资讯 >
R语言—散点图
发布时间:2020-08-14 04:09 | 信息来源:Yabo下载

  授予每个自然月内发布4篇或4篇以上原创或翻译IT博文的用户。不积跬步无以至千里,不积小流无以成江海,程序人生的精彩需要坚持不懈地积累!

  SQLite数据库—select—group、distinct、limit、offset用法

  版权声明:本文为博主原创文章,遵循CC 4.0 BY-SA版权协议,转载请附上原文出处链接和本声明。

  1)使用plot函数可绘制散点图,运行命令时依次传递给plot()函数一个向量x和一个向量y

  ps:通过设定点形参数可以在散点图中绘制默认值以外的点形(系统默认为为2),如:

  通过指定geom_point()函数中的点形(shape)参数可以设定散点图中所有数据点点形

  如果已将分组变量映射给shape,则可以调用scale_shape_manual函数来修改点形

  点形1—20的点的颜色,包括实心区域的颜色都可由colour参数来控制,对于点形21-25而言,边框线和实心区域的颜色则分别由colour和fill参数控制

  讨论:基本散点图通过将两个连续型变量分别映射给x轴和y轴来刻画它们之间的关系,当变量超过两个时,我们必须将它们映射到其他图形属性上,如数据点的大小和颜色。

  当我们把一个连续性变量映射给某个图形属性之后,这并不妨碍我们同时将分类变量映射给其他图形属性

  如图:将变量weightLb映射给点size属性,同时将变量sex映射给colour属性。(图形中有很多重合的数据点,因此用alpha=.5设定为半透明)

  注意:将某个变量映射给size属性时,最好避免将其他变量映射给shape属性,因为不同点形的点大小很难相互比较,比如,大小为4的三角形看起来比大小为3.5的圆形更小。

  针对大数据集绘制散点图时,图中各个数据点会被彼此遮盖,从而妨碍我们准确地评估数据的分布信息,这就是所谓的图形重叠,如果图形重叠程度较低,我们可以通过使用较小的数据点或者使用不会遮盖其他数据点的点形来避免数据重叠

  stat_bin_2d()函数分别在x轴和y轴方向上将数据分割为30个组,总计900个箱子

  对于这两种方法,在手动设置分箱范围时,因为数据点太多或太少,会出现一个在分箱范围外的箱子,且这个箱子的颜色会显示为灰色,而不是最大或最小值对应的颜色

  当散点图的其中一个数据轴或者两个数据轴都对应于离散型数据时,也会出现图形重叠的情况

  这时候可以调用position_jitter()函数给数据点增加随机扰动。默认情况下,该函数在每个方向上添加的扰动值为数据点最小精度的40%,不过,也可以通过width和height参数对该值进行调整。

  当数据集对应于一个离散型数据轴和一个连续型数据轴时,箱线图可能是一种较好的展示方式,如下图。箱线图所表现的信息与散点图略有不同,因为他很难反应出离散坐标轴上每个位置的数据点数量的信息,箱线图的绘制方式有时是缺点,但有时候却是恰如其分的可视化方法。

  对于Chickweights数据集,其对应于x轴上的数据是离散的,但其被存储为数值型向量,因此,ggplot()不知该如何对该数据集进行分组,调用aes(group=...)可以告诉ggplot如何对数据进行分组

  运行stat_smooth()函数并设定method_1m即可向散点图中添加线性回归拟合线m()函数对数据拟合线性模型。首先,我们将在基本绘图对象存储在对象sp中,然后,再添加更多的图形部件

  在生物信息分析中是应用比较广的一个图,常见的差异基因火山图、功能富集分析泡泡图、相关性分析

  的输入一般都是规规矩矩的矩阵,可以让不同的列分别代表X轴、Y轴、点的大小、颜色、形状、名称等。输入数据格式 (使用火山图的输入数据为例)火山图需要的数据格式如下id: 不是必须的,但一般的软...

  引言ggplot2包的作图质量毋庸置疑,但是其作图语法对新手来说还是有点难度,ggplot2:数据分析与图形艺术这本书也介绍了ggplot2包的基本哲学思想和操作,个人感觉例子还不够丰富,所以对该包的用法还是停留在半瓶醋的水平。某天,突然发现一本ggplot2包的例子书,大喜,英文版名字为


Yabo下载
网站地图 人才中心
Copyright © 2006-2019 YONGHUI SUPERSTORES, All Rights Reserved. 中国福建省福州市西二环中路436号 消费者服务热线:4000601933 公安机关备案号 35010202000593 法律顾问:通力律师事务所 翁晓健、张洁律师团队本站由Yabo下载建设维护