方法选择正确的数量的集群
介绍
聚类是一种无监督的机器学习方法,它可以识别组织类似的数据点,称为集群,从数据本身。一些聚类算法,如k - means,事先需要知道有多少集群。如果指定集群的数量错了,结果…
介绍
聚类是一种无监督的机器学习方法,它可以识别组织类似的数据点,称为集群,从数据本身。一些聚类算法,如k - means,事先需要知道有多少集群。如果指定集群的数量错了,结果…
并不是所有的顾客都是一样的。他们的偏好,购买力,准备进入长期合同和其他特征将在广泛不同。
产品、价格值命题或促销活动可能产生共鸣的一群客户,但与他人的失败。会有代际差异和性别差异…
k - means可能是一个最简单的机器学习算法。无人监督的,只有一个参数,基于原则相对简单的理解。然而,当应用到高维度、复杂的数据,它做什么,它是如何…
颜色量化是一个过程,降低了图像的颜色数量,它试图保持质量和重要的全球信息。图像由像素都可以关联到16777216年不同颜色的RGB颜色空间,这是…
k - means聚类有许多潜在的应用在数据分析问题,需要大量的样本之间的关系被发现。这项技术背后的概念非常简单,因此也非常灵活,它可以单独使用与许多可能的配置或与其他机器学习…
无监督聚类方法的算法从大量文本数据帮助总结信息通过创建不同的集群。这个方法是有用的了解你的数据集主要是和不同的类别,可以将文本的上下文位于数据集。
在…之前
在我的工作作为一个数据科学家,我也常常遇到的问题,简单的算法不满足,因为他们陷入局部最优。这经常导致很多挫折在开发期间,因为你第一次认为你的方法是工作,后来才发现,…
如果你曾经想段数据分成组,你可能已经尝试过著名的k - means算法。因为它是如此简单,它被广泛使用,但它的简单性也有几个缺点。…
k - means聚类算法是一个非常简单的和无处不在。但是经常不处理你的问题,例如,因为初始化是不好的。我最近遇到了类似的问题,我应用k - means较少的文件在我的数据集和一切工作…
媒介发布共享的概念,思想和代码。