即使别人拒绝你,你也要保持好奇心,跟着兔子走gydF4y2Ba
Robert McKeon Aloe谈到了数据,咖啡,以及在每个转折点质疑假设的重要性。gydF4y2Ba
在作者聚焦系列中,TDS编辑与我们社区的成员聊天,讨论他们在数据科学方面的职业道路、他们的写作和他们的灵感来源。今天,我们很高兴能和gydF4y2Ba罗伯特•麦肯芦荟gydF4y2Ba.gydF4y2Ba
在2006年,gydF4y2Ba罗伯特。gydF4y2Ba他在底特律Mercy获得了电气工程学士和硕士学位,然后到圣母大学攻读计算机科学与工程博士学位。在他关于3D人脸识别的论文中,他将结构光与物体跟踪相结合,构建了一个新颖的3D人脸扫描仪。gydF4y2Ba
后gydF4y2BaggydF4y2Ba在进入苹果公司之前,罗伯特在一家从事3D人脸识别研究的初创公司工作了四年。在苹果,他为第一代Apple Watch研究手腕检测和背景心率,然后为Face ID、AR Kit和盲人用户研究机器学习。gydF4y2Ba
除了咖啡,他的大部分时间都花在了和家人在一起,以及学习意大利语、阅读、园艺、搭乐高积木、跑步、滑雪和玩迪士尼等爱好上。gydF4y2Ba
对于那些只熟悉你的gydF4y2Ba咖啡的数据写gydF4y2Ba,你在数据科学和计算机视觉方面的主要专业领域是什么?你最感兴趣的主题是什么?gydF4y2Ba
我是在大学上图像处理课程时开始从事这一领域的。我爱上了问题空间在算法开发和实时运行算法方面的难度。班级项目——高级设计项目——是为一个自主机器人做计算机视觉。gydF4y2Ba
当我读研究生的时候,我真的很想研究自主机器人。选择很少,最后我选择了3D人脸识别。我觉得在计算机视觉领域有足够的重叠,很快,我发现我一半的工作是数据科学。在我的论文中,我设计并制作了一个3D面部扫描仪,你可以通过它走过去,然后我继续收集了数千张人们的扫描图,用于一个大规模的测试集。gydF4y2Ba
“数据为王”已经成为我的口头禅。gydF4y2Ba
我总是被难题所吸引。3D人脸识别是一个难题,最终要靠数据来解决。之后,我被更广泛的问题所吸引,“计算机视觉如何改善我们的日常生活?”这一点在可访问性领域表现得非常明显,这与我参与的任何其他项目一样具有挑战性。gydF4y2Ba
是什么让你决定探索浓咖啡制作背后的数据科学?你是如何开始这个旅程的?gydF4y2Ba
我的旅程是从不满开始的。我已经非常擅长在工作中使用我的浓缩咖啡机,我在家里有一杯拉帕沃尼咖啡。然而,我喝到的浓缩咖啡却没有那么好。所以我开始制作一张数据表来帮助我弄清楚如何做出更好的咖啡。当我使用这个数据表来跟踪所有相关变量时,它迅速扩展了。一旦我能够追踪它们,我便能够在大型实验设计中分析原因和结果。gydF4y2Ba
从你正在进行的咖啡研究中,你从数据中学到的最重要的东西是什么?gydF4y2Ba
问题的假设!gydF4y2Ba
当我开始为咖啡做一些数据科学的东西时,我以为这一领域的大部分内容都已经解决了。当我开发了断断续续(筛和分层)浓缩咖啡时,我受到了很多抵制,我开始意识到知识的深度并不在那里。也许它来自个人经验,或者隐藏在付费墙或公司背后,但它不是免费提供的。gydF4y2Ba
因此,我开始质疑每一个假设,并试图对浓缩咖啡的每一个变量进行数据分析。我认为这在数据科学中是典型的;你必须保持好奇心,即使别人拒绝你或反对你的实验,你也要跟着兔子走。你可能是错的,但你可能发现了一些东西。gydF4y2Ba
咖啡是奇怪的。我最近惊奇地发现,便宜的研磨机比昂贵的研磨机性能更好。当我深入调查时,我很难找到原因。它们有相似的粒子分布,但当我开始用一些模式识别来比较这些粒子时,我发现其中一些粒子的形状不同。所以有时候,性能差异的原因并不在表面层面。gydF4y2Ba
你现在正在写一本书gydF4y2Ba它收集与咖啡相关的数据写入。你希望读者从这本书中得到什么,而不是通过离散的文章来获得的?gydF4y2Ba
我已经写作几年了,我很难找到一个好方法来组织我所有的文章。我发现,与咖啡的面积相比,咖啡的数据并不多。所以我把所有东西放在一起,想看看会是什么样子,结果太多了。我有1200页的材料。我问我所在的一个咖啡小组,家庭浓缩咖啡爱好者,我应该怎么做。每个人都建议写200页左右。gydF4y2Ba
我决定展示如何改善每一个变量的浓缩咖啡。然后,读这本书的人就可以逐步改进他们的浓缩咖啡,并有一个从好的浓缩咖啡到更好的浓缩咖啡的起点或计划——甚至是最好的浓缩咖啡。gydF4y2Ba
每篇文章都深入讨论一个主题;这本书善于从一万英尺的角度展示所有变量。从这个角度看,它可能看起来不那么杂乱,因为浓缩咖啡有很多难以分类的变量。gydF4y2Ba
你已经成功地选择了一个相当狭窄的领域,并且仍然能够源源不断地想出新的文章创意。对于那些想写自己专业领域的文章的人,你有什么建议吗?gydF4y2Ba
我开始写关于工作的故事。我意识到我有很多故事可以帮助人们——尤其是刚进入职场的毕业生。故事对我来说一直都很重要。当我发现我的技能可以增加价值时,我将业务扩展到了咖啡领域。对于工作故事和生活故事,我首先进行了头脑风暴,列出了一个主题列表,我承诺每周出版一次,然后在固定的日子每周出版两次。gydF4y2Ba
一开始,我并没有太多关于写咖啡的想法,但我做了很多实验。我很快就决定发表我所有的实验——即使是愚蠢的、疯狂的和奇怪的实验。我真的很依赖我的多动症,所以我的写作过程被分成实验(图片,数据,大纲),初稿和最终稿。gydF4y2Ba
有几个星期,我专注于其中一个领域,比如实验。我做了一堆实验,把笔记写进文档里。然后我会花一周的时间做多个初稿,最后,我会在一周内完成5到10篇文章。这个过程符合我天生的好奇心和对截止日期的需求。gydF4y2Ba
如果你想写点什么,就从你的故事开始。为什么你会爱上你的研究领域,你的爱好,你的伴侣,你的音乐?从你容易写的东西开始,然后从那里开始写。gydF4y2Ba
开始写作的另一个方面是专注。你关注的是你自己和这篇文章将为你带来什么,还是你关注的是这篇文章将为你身后的人带来什么?这些人是给新来的人写的。gydF4y2Ba
对于全职工作的数据科学家来说,挤出时间进行公开写作一直是他们的痛点。你是如何平衡这两者的?gydF4y2Ba
我开始小。问题是要看收益在哪里。对有些人来说,写作是为了获得认可或赚钱。我的目标是为了写作的过程。我发现这个过程是放松和宣泄的。每一件作品都给我提供了一个更大的反思和评价的机会。gydF4y2Ba
至于有一份全职工作,我努力保持工作和生活的平衡,这样我就有时间写作。我们经常谈论平衡工作和生活,但现实是我们大部分时间都在工作,有时也有一些生活。通过让我们的现实与理想相匹配,我们就有时间以与工作无关的方式编写和分析数据。gydF4y2Ba
你的日常工作和公开写作是否在思想、过程或见解方面产生过交叉影响?gydF4y2Ba
我的目标不是成为职业作家或咖啡爱好者。我的大部分文章都没有付费,这是唯一的原因gydF4y2Ba我为我的书发起了众筹gydF4y2Ba是用来支付平面设计,编辑和印刷的费用。我非常喜欢我的专业工作以及它对世界的影响。gydF4y2Ba
想法不会相互影响,但过程会。我在工作中分析数据的方式影响了我看待咖啡数据的方式。我并行处理多个项目的方式被复制到我并行写多个主题的方式中。优先排序的关键概念已经在我的工作中根深蒂固了,结果是我把我的写作按优先顺序排列。我总是按优先级排列一个主题列表,总有一些主题我永远都不会接触到,因为它们的优先级不够高。gydF4y2Ba
最后一个问题:在2022年,你最想探索的项目和新的学习领域是什么?gydF4y2Ba
我已经积累了大量的浓缩咖啡知识,我想找到一些方法,为不同的人群提取最好的浓缩咖啡。我的第一本书关注的是那些喝过浓缩咖啡的人。我想为那些刚刚接触浓缩咖啡的人写点什么,也为那些超级关注科学的浓缩咖啡爱好者写点什么。gydF4y2Ba
想要了解罗伯特的作品,你可以浏览gydF4y2Ba他的TDS关于咖啡数据科学的文章档案gydF4y2Ba,或退房gydF4y2Ba他自己按主题组织的Medium帖子集合gydF4y2Ba.你也可以跟着他gydF4y2Ba推特gydF4y2Ba而且gydF4y2BaLinkedIngydF4y2Ba.你可以了解更多关于他即将出版的书gydF4y2Ba在该项目的Kickstarter页面上gydF4y2Ba.gydF4y2Ba