数据统治着世界——它就是一切,它是它在任何努力中用来交流发现的主要原因之一。要以易于理解的格式呈现此类数据,您需要图表或图形——这就是散点图发挥作用的地方。大问题来了——什么是散点图?
散点图被广泛称为相关图、散点图或散点图。它是用于确定两个变量之间关系的最佳工具之一。理想情况下,一个变量绘制在水平轴上,而另一个变量绘制在垂直轴上。
交点几乎显示了关系模式。通常,散点图用于肯定或否定两个变量之间的因果关系。
散点图的主要目标之一是确定两个变量之间的关系。使用散点图研究具有两个以上变量的数据集会有些困难。
仍然不确定散点图是什么,以及如何使用它?好吧,这是一种更好的看待它的方法。继续阅读,您将找到所有答案,并且还将了解有助于轻松创建此图表的可视化库。
什么是散点图?
定义:散点图(或 xy 图)是设计用于表达两个变量或数据点之间关系的图表。这是它的工作原理……
沿 x 和 y 轴绘制两个数据点。x 轴代表自变量,而 y 轴代表因变量。该规则并非一成不变,因为您可以在某些散点图中找到代表自变量的两个轴。
但是为什么专家们使用散点图这个术语呢?好吧,当在这两个轴上绘制数据时,结果图会分散。作为营销人员,您可以使用散点图来分析 SEM 营销中的关键字数据。
现在您已经很好地掌握了散点图是什么,以及为什么将其命名为散点图,这就是您应该使用散点图和散点分析的原因。
散点图的类型
什么是散点图?好吧,你现在可能已经知道这个问题的答案了。除了很好地掌握散点图是什么之外,您还必须了解各种类型的散点图。
散点图的划分取决于它们的相关性和斜率类型。当涉及到相关性时,散点图分为三个 –
- 强相关\正相关
- 中度相关\负相关
- 无相关性\无相关性
具有强相关性的散点图
在这种类型的散点图中,数据被标记为一个点,因变量在 y 坐标上,而自变量在 x 坐标上。通过仔细查看图表,您会发现这些点以线性模式排列——您可以通过绘制一条直线轻松地将它们连接起来。
这种排列表示数据之间存在很强的关系(或相关性)。专家选择将其称为具有强相关性(或高度相关性)的散点图。
具有中等相关性的散点图
也称为低相关度的散点图——数据点有点非线性,很难通过它画一条直线。此外,数据点(标记为点)彼此靠近排列。
无相关性的散点图
在这种类型的散点图中没有相关程度或对齐。大多数时候,数据点分散在各处,很难追踪它们之间的任何形式的关系。
为什么要使用散点图和散点分析?
- 散点分析显示两个变量或数据集之间是否存在任何实际关系。也就是说,它定义了两个变量之间的关系。
- 对于每个自变量,有多个因变量值。
- 有成对的数字可以帮助您确定每个变量的值。
可以在散点图上表示的数据类型
通常,连续数据在散点分析中表示。与您获得通过/失败测量的离散数据不同,连续数据用于测量无限的数据集。
一些营销人员更喜欢在散点图的一个轴上使用连续数据,而在另一轴上使用离散数据。在使用离散数据时,您应该通过用数字表示它来量化它(比如说 1 – 10)。
散点分析并非一帆风顺——您会遇到一些问题,以下是您在使用散点图时可能会遇到的常见问题。
到目前为止,您可能已经很好地掌握了一个大问题——什么是散点图?以及散点图上表示的数据类型。以下是如何解释散点分析。
如何解读散点图上的数据分析?
每个市场都有趋势,而且大多数时候,统计数据用于表示这些趋势——这就是散点图发挥作用的地方。问题在于解释这些数据。这是解释散点分析的简单方法。
散点图由观测值(或点)组成,每个点都有两个坐标。第一个坐标代表一条数据——向左或向右移动得到的数据,而第二个坐标代表第二条数据。通常,通过向上或向下移动找到第二条数据。
第一条数据通常落在 X 坐标上,而第二条数据通常落在 Y 坐标上。理想情况下,在这两个坐标的交界处放置一个点(或点),点(或点)代表观察。
这里有一些你需要知道的……
在解释散点图时,您可以通过从左到右移动来查找趋势。如果从左到右观察趋势时出现上坡模式,则表明两个坐标(X 和 Y 坐标)之间存在正相关关系。即,随着X轴的值增加,Y轴的值也增加。
如果您通过从左到右移动来观察下坡模式,这意味着 X 和 Y 坐标之间存在负相关关系。也就是说,当您向右移动时,X 值增加,而 Y 值减小。
最后,如果坐标之间没有散点图模式(或关系),那么观察到的数据中的关系为零。
有时,您可能会在数据集中观察到线性模式,但这并不意味着数据集之间存在任何类型的依赖关系。
例如,如果绘制广告活动支出的散点图,您会发现在广告上花费大量的营销人员往往会产生更多的结果并获得更多的利润。但这绝不表明在广告活动中花很多钱会产生利润。
可能是在广告活动上花更多钱的营销人员更有经验,因此可能会写出更好的广告文案并瞄准合适的受众。
你看,线性关系并不一定意味着一个坐标完全依赖于另一个坐标。
接下来,您需要了解各种类型的散点图。
如何创建散点图?
ChartExpo 是可以帮助您创建散点图的高级可视化工具之一。
部门 | 姓名 | 年龄 | 表现得分 | 准时 |
研究与开发 | 提摩太 | 24 | 20 | 44 |
研究与开发 | 理查德 | 26 | 30 | 62 |
研究与开发 | 迈克尔 | 29 | 25 | 74 |
研究与开发 | 保罗 | 23 | 27 | 89 |
研究与开发 | 鲍尔斯 | 38 | 32 | 96 |
研究与开发 | 克里斯托弗 | 32 | 36 | 59 |
研究与开发 | 大卫 | 45 | 34 | 80 |
研究与开发 | 约瑟夫 | 22 | 42 | 50 |
研究与开发 | 帕特里克 | 26 | 43 | 83 |
研究与开发 | 普赖尔 | 40 | 47 | 82 |
会计和财务 | 约翰逊 | 60 | 28 | 40 |
会计和财务 | 科尔伯特 | 55 | 60 | 75 |
会计和财务 | 鲍曼 | 45 | 65 | 83 |
会计和财务 | 弗朗西斯 | 50 | 50 | 71 |
会计和财务 | 柯林斯 | 42 | 55 | 55 |
会计和财务 | 乔纳森 | 30 | 58 | 48 |
会计和财务 | 埃里克 | 60 | 56 | 96 |
会计和财务 | 谨慎 | 29 | 82 | 75 |
会计和财务 | 汤普森 | 48 | 20 | 76 |
会计和财务 | 坦率 | 40 | 59 | 65 |
销售和营销 | 杰罗姆 | 22 | 63 | 70 |
销售和营销 | 罗纳德 | 28 | 70 | 56 |
销售和营销 | 沃克 | 30 | 75 | 87 |
销售和营销 | 战士 | 44 | 86 | 62 |
销售和营销 | 卡尔森 | 33 | 90 | 76 |
销售和营销 | 彼得森 | 24 | 95 | 75 |
销售和营销 | 博伊尔 | 29 | 97 | 50 |
销售和营销 | 伦登 | 36 | 99 | 61 |
销售和营销 | 戈麦斯 | 44 | 100 | 88 |
销售和营销 | 胜利 | 27 | 50 | 59 |
假设您已经有了一个数据表,这就是您需要做的。
如果你还没有下载这个库,你可以直接安装 ChartExpo Add-on for Google Sheets。
安装后,您必须通过单击 ChartExpo 导航到 Google Sheet Add-on 上的 ChartExpo 部分。
接下来,单击创建图表。
接下来,从提供的各种选项中选择散点图。
选择所需的指标和维度,然后单击创建图表按钮。您的图表将显示在您的屏幕上。
最后,您必须跟踪各种变量之间的关系。
象限代表不同的年龄组,并在各自的部门有表现。平行于 y 轴的平均线表示平均年龄,平行于 x 轴的平均线表示平均年龄。代表每个人守时的大小。如果您看到如何添加图表标题,更改图例颜色,还可以为每个部门添加趋势线。现在,让我们从如何添加标题开始。
一个。如何添加图表标题:
您可以通过单击编辑图表来添加标题。
现在,您必须单击突出显示的笔,您可以根据需要添加图表标题。
湾。如何更改图表中图例的颜色:
单击突出显示的笔,然后从那里转到框,您可以选择任何颜色。使用相同的方法,您可以更改任何其他图例的颜色。
现在,单击保存以保存所有更改。
C。添加趋势线:
您可以显示部门的趋势线。
他可以通过单击窗口右上角的图表设置来完成。
现在,他将点击趋势线。之后,他将单击“显示”按钮。从多项式线中,他可以选择他想要的任何度数线。在这种情况下,假设他想要 3 度趋势线。之后,他将单击“应用”。
不同的颜色代表不同的部门,趋势线代表各部门年龄的表现趋势。例如,销售和营销部门的趋势是上升到 36 岁,然后慢慢下降。这些见解可能对公司有所帮助。
继续前进,在使用散点图之前要记住以下几点。
散点图的应用
这是散点图的一些常见应用。
1. 散点图显示两个变量之间的关系
理想情况下,散点图用于显示两个变量之间的关系。它不仅显示了变量之间的关系,还显示了这种关系的性质。
这种关系可以是线性的或非线性的、弱的或强的、正的或负的。通常,散点图上的数据点代表每个数据点的值。它还可以帮助您识别散点图上的整体模式。
2.显示相关关系
散点图显示相关关系。理想情况下,因变量位于垂直坐标上,而自变量位于水平坐标上。这样,您可以轻松识别垂直轴上的可能值,前提是水平轴上的值是已知的。
3.数据模式识别
散点图显示了模式——这是使用它的核心好处之一。通常,分组取决于值的接近程度。这样,您就可以轻松识别任何异常值。
继续前进,这里有一些您可能会在散点图中观察到的散点图模式的解释。
- 如果标记的点(数据点)向上倾斜,从图的左下区域到图的右上区域,那么你就得到了正相关——这就是上升。
- 如果标记的点(数据点)向下倾斜,从图的左上角区域到图的右下角区域,那么你就得到了负相关——这就是下降。
- 当数据集之间既没有正相关也没有负相关时,获得不相关(或空)数据。
是的,一切听起来都很好,但散点图并不是每次都可以使用的。这是不使用散点图的时候。
在这里快速回顾一下。您知道这个大问题的答案:什么是散点图、使用散点图的好处、散点图上展示的数据种类以及散点图的类型。
但是使用散点图的优缺点是什么?好吧,这是你需要知道的。
使用散点图的优点
使用每种数据可视化工具都有优势。对于散点图,这里是使用该工具的优点。
- 散点图是展示大型数据集之间相关性的最佳工具之一。
- 它有助于查明两个数据点(或变量)之间的关系。
- 这是一种在原始数据中显示非线性关系的可行方法。
- 需要零技术技能,而且情节和理解非常简单。
- 您可以很容易地识别散点图中的最大值和最小值,并且跟踪流量的数据范围很容易。
- 散点图可帮助您查明数据集中的确切值。
使用散点图的缺点
使用散点图并不乐观——这里是使用散点图的缺点。
- 散点图不适合显示两个以上变量的关系。
- 仅推荐用于具有数值的数据。
- 有时,散点图中的关系可能会受到第三个变量的影响。因此,假设一个变量依赖于另一个变量可能是错误的和不准确的。
- 散点图显示的直线越多,两个变量之间的关系越强。
- 有时,当自变量(x 轴)变化很大时,散点图中将没有关系。
散点图——什么时候不用
散点图提供了一种可视化数据的简单方法,但这并不是说它适用于所有情况。在以下情况下,使用散点图并不理想。
1.当有大量数据集时
当散点图中有大量数据时,最终可能会堵塞整个图形区域,并可能导致过度绘制。
通常图形区域中的数据点变得如此密集,最终形成一个大斑点。从这样的散点图中读取任何内容都非常具有挑战性。
如前所述,您可以通过仅使用热图之类的替代方法来解决过度绘图的问题。热图几乎可以显示数据集中最密集的区域。
此外,您可以使用各种颜色代码来创建半透明标记点——这是为您的分析创建类似热图的效果的更可靠方法。
总而言之,当有很多数据点时,您应该避免使用散点图。使用散点图时,形成大斑点的可能性很高。
2.当一个点不相关时
在某些情况下,您可以预测某些数据集不相关。在这种情况下,你必须继续前进——不需要使用散点图。
为什么?因为没有相关性,散点图对你没有好处。例如,一个地区的人的体重数据和他们家中的椅子数量没有相关性。
由于房屋中椅子的数量不取决于拥有房屋的人的体重,因此使用散点图进行此类分析对您没有好处。
3.当有多个因变量时避免散点图
有时您可以跟踪具有多个因变量的数据集。通常,跟踪此类数据集可能有些困难。
如果您希望跟踪具有多个因变量的数据集,则必须更改每个因变量的颜色。这样,您就可以轻松监控散点图上的每个数据点。
散点图注意事项
在创建散点图之前,请注意以下几点。
- 无论散点图中观察到的关系如何,都不要假设一个变量依赖于另一个变量。第三个变量可能是影响因素。
- 观察散点图时,标记的点越直线,变量之间的关系越强。
- 如果数据是分层的,那么变量之间的关系很可能为零。
- 如果一条线不清楚,那么您应该检查两个变量之间是否存在关系的合理确定性。如果没有关系(或相关性),则该模式可能是随机出现的。
- 如果您在散点图中没有观察到任何关系,请检查自变量是否涵盖了广泛的范围。有时,零关系意味着数据范围不够宽。
常见问题解答:
什么是散点图?
散点图用于分析两个变量之间的关系(或相关性)。使用散点图,您可以轻松识别两个变量之间的关系。理想情况下,一个变量绘制在 Y 轴上,而另一个变量绘制在 X 轴上。
交点表示变量之间的关系。在散点图中,一个变量绘制在垂直轴上,而另一个变量绘制在水平轴上。
散点图的主要目的是什么?
散点图的主要目的是显示两个变量之间的关系。标记的点显示数据点的值和在数据上找到的整体模式。通常,散点图用于识别相关关系。
如何在谷歌表格中制作散点图?
您可以使用 ChartExpo Add-on 在 Google 表格中轻松创建散点图。
包起来
无论您是营销人员还是分析师,您都会同意使用原始、无组织的数据非常困难。但是数据可视化使得将数据转换为易于理解和有用的东西变得非常容易。
使用散点图,您可以轻松识别任何数据中的散点图模式和趋势。这样,您就可以做出更明智的决定。此外,散点图可以帮助您查看全局而不会遗漏任何内容。
到你了…
什么是散点图,您将如何在ChartExpo 的下一次数据分析中使用它?