开始

在应用中打开

开始

分享概念、想法和代码的媒体出版物。

遵循

关于

开始

在应用中打开

工程数据

在欧宝全站登录．更多关于媒介．

安杰莉卡·洛·杜卡

·22小时前

数据库

从原始数据到清洁的数据库:深入研究通用的数据工具包

一个使用通用数据工具包(VMware最近发布的一个框架)和Trino DB的完整示例

最近，VMware发布了一个新的开源工具，叫做多功能数据套件(简称VDK)，它允许非常快速地管理数据。该工具允许用很少的代码行将不同格式的数据吸收到单个数据库中。

在我之前的文章，我描述了一个基本的例子，其中…

阅读更多·8分钟读取

吊杆Mwiti

·1天前

什么是MLOps?

MLOps解决了哪些问题和最佳实践

构建机器学习模型包括创建模型、训练模型、调优模型和部署模型。这个过程应该是:

可伸缩的
协作
可再生的

例如，如果构建了一个优秀的模型，但不能在生产环境中重现结果，这将是令人遗憾的。一整套原则、工具和技术……

阅读更多·9分钟读取

巴尔摩西

·1天前

构建数据平台时需要考虑的5件不明显的事情

在迁移到梦想中的自助服务数据平台时，需要回答以下5个重要问题

构建数据平台—例如，为您公司的所有数据建立一个中央存储库，使数据的获取、存储、交付和治理成为可能，同时保持整个数据生命周期的安全性—已经成为当今数据团队的必经之路。数据平台在现代社会中至关重要。

阅读更多·9分钟读取

Jyoti Dhiman

·5天前

Spark结构化流简化

Spark流数据处理的简单概述

嘿人!

如果您是Spark流处理的初学者，或者即使您已经使用过多次，但希望更好地理解Spark结构化流，那么这篇文章就是为您准备的!

在讨论在Spark中处理流数据之前，让我们先了解什么是流…

阅读更多·5分钟读取

乔治Myrianthous

·4天前

数据湖与数据仓库

数据湖和仓库之间的区别是什么?

简介

当涉及到永久存储数据时，数据湖和仓库可能是两种最广泛使用的存储类型。在这篇文章中，我们将探讨这两者，揭示它们的关键区别，并讨论它们在组织环境中的使用。

简单来说就是数据仓库和数据湖

一个数据仓库是……

阅读更多·5分钟读取

麦克尔-邓øe

·4天前

发霉的数据和仪表盘

我以一张发霉食物的图片开始向我们的领导团队展示，以描述当时的数据状况。

每个人的第一个反应是:“恶心”，然后是“啊，对，就是这种感觉!”

发霉的数据是什么时候

仪表板具有过时的指标定义
只有仪表盘……

阅读更多·6分钟读取

王进辉

·4天前

映射，过滤，约简-功能性数据管道设计的高阶函数

深入探讨高阶函数，以及如何在为函数式数据管道设计数据转换时使用它们

回顾

在我之前的帖子上“控制流”的函数式编程特性，我提供了函数组合的概述，并讨论了高阶函数的使用和递归作为“函数迭代”的一种形式。

在这篇文章中，我们将探索更多关于高阶函数以及它们如何用于…

阅读更多·10分钟读取

埃德温·谭

·4天前

如何用熊猫填充缺失数据

初学者指南

简介

处理缺失数据是任何数据科学工作流程的重要组成部分。处理缺失数据的常用方法包括(a)忽略缺失数据，(b)删除缺失数据的记录或(c)填充缺失数据。…

阅读更多·7分钟阅读

丹尼斯Gontcharov

·2月4

部署气流谷歌Kubernetes发动机与头盔-第二部分

添加创建数据并将数据写入GCS的DAG

注:这里是链接到本文的第一部分．

简介

在本文的第一部分中，我们在GKE上托管的Kubernetes集群上获得了一个功能良好的风流部署。通过编辑值。yaml文件，我们让GCP部署一个LoadBalancer的气流web服务器，并取代…

阅读更多·10分钟读取

肯尼斯·梁

·2月3

Mlops专业化系列

从MLOps专业化的关键学习点-课程3

来自DeepLearning的机器学习工程生产(MLOps)课程的主要见解(包括课堂笔记)。AI & Andrew Ng

虽然机器学习(ML)和深度学习概念是必不可少的，但拥有生产工程技能在用数据科学解决现实问题方面同样(如果不是更重要的话)至关重要。

DeepLearning。一个I developed theMLOps专业化课程分享在生产中构建和维护ML系统的实践经验。

在这篇文章中，我总结了……

阅读更多·9分钟读取

欧宝全站登录

分享概念、想法和代码的媒体出版物。

使用Medium应用程序

map