Wouter Van Heeswijk,博士 ·2天前 强化学习的政策梯度解释了 了解基于似然比(增强)的政策梯度算法:直觉,派生,“日志技巧”,并更新高斯和软马克斯策略的规则。- 当我第一次研究政策梯度算法时,我发现它们很容易理解。直观地,它们似乎足够简单 - 样本动作,观察奖励,调整政策 - 但是在最初的想法遵循了许多漫长的派生,我长期以来一直忘记的微积分技巧以及压倒性的… 政策梯度 15分钟阅读
纳雷什·拉姆(Naresh Ram) ·23小时前 如何应用人造蜜蜂菌落算法解决非常规问题 解决难题。学习新算法。双赢。完整代码。- 我上一篇文章所涵盖的人造蜜蜂殖民地(ABC)算法非常灵活,但它足够灵活,可以解决一个非常规问题。逻辑难题?答案被证明是“为什么不呢?”。因此,我们将详细介绍如何建模和解决它。经历这个过程… AI 11分钟阅读
卡梅隆·沃尔夫 ·4天前 对视频的深度学习(第三部分):深入研究3D CNN 这篇文章是我作为Alegion研究科学家作品的一部分的视频深度学习方法的系列中的第三篇文章。这一系列博客文章的目的是概述视频深度学习的历史,并提供相关性… 卷积网络 16分钟阅读
艾琳·张 ·更新4天前 SQL到Sarimax:我如何浏览我的投资组合的第一个时间序列分析个人项目 包括我在进行此项目时用来学习时间序列的资源(MySQL,Arima订单选择,Jupyter笔记本中的并行化等) - 集思广益我创建个人项目的过程通常始于知道我的技能或知识类型或知识类型想学习或改进。对于这个项目,我有两个目标:(1)学习时间序列分析和(2)练习将SQL技能应用于现实生活项目。 时间序列分析 11分钟阅读
汤姆Z. Jiahao ·4月2日 深入学习动态 - 直觉 深度学习在学习动力学方面显示出令人鼓舞的结果,这是两种流行方法背后的直觉,并用使用Pytorch编码的示例说明了。- 这篇博客文章在深度学习中具有一些基本知识。本文中使用的所有代码都可以在我的github中找到:https://github.com/tomjz/deeplearningfordynamics-intuition-intuition差异方程式大多数物理模型都是用微分方程(des),特别是普通微分方程(DES)编写的,部分微分方程(PDE)。牛顿的普遍重力定律写道。 深度学习 15分钟阅读
麦迪逊·肖特 ·5天前 我如何组织雪花数据仓库 您应该存储数据的数据库,模式和表格 - 您的数据仓库是现代数据堆栈的枢纽。数据通过诸如Airbyte之类的数据摄入工具流入其中,确保可以使用原始数据。使用SQL和现代数据转换工具(如DBT)进行了数据转换。… 雪花 10分钟阅读
FelixHofstätter ·更新4月4日 如何阻止您的人工智能代理商攻击奖励功能 使用因果影响图和当前RF优化 - 在许多最近的增强学习方法(RL)中,程序员在运行训练算法之前定义的恒定函数不再给予奖励。取而代之的是,有一个奖励模型是作为培训过程的一部分学习的,并且随着代理商发现新信息的变化…… AI安全 13分钟阅读
Reza Bagheri ·3月31日 形状值及其在机器学习中的应用 了解摇摆图库在引擎盖下的工作原理 - Shap是一种数学方法来解释机器学习模型的预测。它基于游戏理论的概念,可用于通过计算每个功能对预测的贡献来解释任何机器学习模型的预测。塑造最多可以决定… 沙普利值 81分钟阅读
丹·罗宾逊 ·3月19日 使用指标确定LDA主题型号大小 超过3分钟的主题建模文章 - 主题建模是在文本主体中自动发现语义上有意义的主题。主题模型产生的类别(表示为单词列表),可用于将文本主体划分为有用的分组。当前用于主题建模的最常见算法是潜在的dirichlet分配… 主题建模 16分钟阅读
阿吉特·拉贾塞卡兰(Ajit Rajasekharan) ·3月30日 几乎所有图像都只有8k向量 图像表示,是生成任务中单词的密切类似模型 - 概述搜索答案:“图像中单词的类似物是什么?”似乎是由多个因素驱动的两条路径的广泛行动 - 被培训的模型的训练(自我监督…... 机器学习 22分钟阅读