消息中间件的诸侯征战史
学习探索性数据分析的另一种方法是编写关于数据集的问题,并尝试从数据集为它们找到答案。比如,如果我考虑最受欢迎的泰坦尼克号数据集,然后尝试寻找问题的答案,比如哪种性别/年龄/甲板的人有更高的死亡概率等等。你进行全面分析的能力会随着时间的推移而提高,所以要有耐心,慢慢地自信地学习。 到目前为止,您已经学习了数据科学家所需的所有核心技能,现在可以学习算法了。 数学怎么了? 是的,了解线性代数和微积分是重要的,但我宁愿不花时间学习数学概念,但当他们需要,你可以参考和温习你的技能,高中水平的数学将是足够的。例如,假设你正在学习梯度下降法在学习算法的同时你可以花时间学习它背后的数学知识。 因为如果你开始学习数学中的重要概念,那么它可能是非常耗时的,而且通过在需要的时候学习,你会学到足够的时间所需要的东西,但是如果你开始学习数学中的所有概念,那么你将会花费更多的时间,学到的东西将远远超过所需要的。 第51天到第70天:监督学习和项目实施 在开始的10天里,学习一些关键的算法,理解它们背后的数学原理,然后在接下来的10天里,专注于通过开发一个项目来学习。这节课要讲的一些算法有:
在最初的10天里,重点应该是理解你所选择的算法背后的理论。然后花些时间了解每个算法比其他算法更适合的场景,比如当数据集中有很多分类属性时,决策树是最好的。 然后选择一个解决的例子在Kaggle,你将能够找到大量解决的例子尝试重新执行他们,但仔细理解每一行代码,并理解他们的原因。到目前为止,您已经获得了良好的理论知识,以及从解决的示例的工作知识。 最后一步,选择一个项目,并实现一个有监督的学习算法,从数据收集、探索性分析、特性工程、模型构建和模型验证开始。肯定会有很多问题和问题,但当你完成项目时,你会对算法和方法有很好的了解。 第71天到第90天:无监督学习和项目实施 现在是时候关注非监督学习了,类似于在监督学习中使用的方法,先花几天时间理解你在非监督学习中选择的算法背后的概念,然后通过实施一个项目来学习。 这里要讲的算法是,
最初的日子里,应把重点放在理解上面的算法和技术也了解他们每个人的目的,他们可以使用的场景像主成分分析通常用于数据集降维,当你工作在一个非常大的列数和你想要减少,但仍保留信息和推荐系统在电子商务流行基于客户的购买模式可以推荐他们可能感兴趣的其他产品来增加销量。 当您熟悉了可以使用它们的理论和场景后,就可以选择一个已解决的示例,并通过逆向工程来学习,即理解每一行代码并重新执行它们。 作为最后一步,现在是选择用例并基于您目前所学实现的时候了。在完成项目/用例时,你会学到很多东西,你会对这些算法有更好的理解,这将永远伴随着你。 第91天到第100天:自然语言处理基础 利用这段时间关注非结构化/文本数据的分析和用例。值得花时间在这里的事情很少
就是这样!现在,您已经介绍了所有重要的概念,可以申请任何数据科学工作了。我已经在我的YouTube频道上开始了为期100天的学习数据科学的教程,如果你感兴趣,请加入我,在这里开始你的学习数据科学的教程。 (编辑:广安站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |