毫无疑问,特征工程是构建机器学习模型最重要的方面之一。研究表明一个好的模型和一个优秀的模型之间的区别可以由你设计功能的方式来决定.
为了提高模型的准确性,你需要……
在构建机器学习模型时,我们知道有太多的特征会带来诸如诅咒的维度此外,还需要更多的内存、处理时间和电源。
在我们的特征工程管道中,我们使用特征选择技术,试图从我们的……
简单的事情看起来很容易。不是吗?以条形图为例,其中包含吸引人的类别和引人注目的数据。一张好的图表可以在7秒内讲完一个故事,使商业领袖能够自信地领导。但在这个过程中,很多事情都是理所当然的。
对于数据科学家来说,获得……
在大数据时代的兴起中,我们可以收集到比以往更多的数据。数据收集不再局限于数字格式的事务数据,而是出现在其他格式和结构中——包括文本、图像、音频甚至视频格式。如果进行相应的处理和分析,我们可以……
说到谈论机器学习,很明显,这是计算机编程的科学(和艺术)学习从数据[1]。然而,这个定义提出了一些问题,第一个问题是:数据?Excel电子表格吗?
人们想到的第一件事(或者至少是第一件事)是……
当我第一次看到时间序列预测问题时,我非常困惑。在那之前,我只是对表格数据做了一些监督学习预测,所以如果我没有目标值,我不知道如何进行预测。...
一个分享概念、想法和代码的媒体出版物。