网站数据分析师应该如何合理地分配时间,该掌握哪些技能(通用技能和技术技能介绍)
小武-网站专员
2022-04-25 12:01:57
262
市场上对数据工作者的要求特别多:需要掌握机器学习、计算机科学、统计学、数学、数据可视化,深度学习等知识。要想全部掌握这些方面的知识,起码需要学习数十种语言、框架和技术,这显然是有难度的。
那么,为此数据工作者应该如何合理地分配时间,该掌握哪些技能呢?
在本文中,我们对求职网站进行搜索,找出针对数据科学家等数据相关工作的技能要求。我分别分析了通常的数据相关技能和特定语言以及工具。
我们具体搜索了LinkedIn、Indeed、SimplyHired、Monster、以及AngelList这些求职网站。
以下图表显示了在每个网站中发布了多少相关工作。
结果表明,通用技能中数据分析和机器学习是数据科学家工作的核心。从数据中收集分析见解是数据科学的主要功能。机器学习是关于开发创建预测性能的系统,这也是十分受欢迎的技能。
数据科学家需要统计学和计算机科学技能,这并不惊讶。统计学、计算机科学和数学也是大学专业,这也可能提高了这些技能出现的频率。
有趣的是,近一半的职位要求中都提到了沟通能力。数据科学家需要能够传达自己的见解,并与他人合作。
人工智能和深度学习并不像其他术语那样经常出现。它们是机器学习的子集,深度学习被用于越来越多的机器学习任务中,之前主要是使用其他算法。如今,大多数用于自然语言处理问题的最佳机器学习算法是深度学习算法。我预计将来在职位信息中,深度学习技能将被越来越明确,而且机器学习将与深度学习越来越类似。
那么雇主希望数据科学家使用哪些特定软件工具?接下来,让我们看到这个问题。
2. 技术技能
以下是雇主最希望数据科学家掌握的前20种特定语言,库和科技工具。
让我们简要介绍一下最常见的技术技能。
Python是最受欢迎的语言。这种开源语言已经非常普及。对初学者而言,这种语言很好上手,有许多支持的资源。绝大多数数据科学工具都与之兼容。Python是数据科学家主要的使用语言。
R语言与Python相差不远。它曾经是数据科学的主要语言,R语言的需求仍然很大。这种开源语言的根源在于统计数据,它非常受统计学家的欢迎。
Python或R语言是从事数据科学工作的必备条件。
SQL的需求也很高。SQL指的是Structured Query Language(结构化查询语言),是与数据库交互的主要方式。在数据科学领域,SQL有时会被忽视,但如果想找数据科学方面的工作,这项技能是很重要的。
接下来是Hadoop和Spark,它们都是Apache的大数据开源工具。
Apache Hadoop是一个开源软件平台,用于分布式存储和分布式处理大型数据集,这些数据集是由商用硬件构建的计算机集群。
Apache Spark是快速的内存数据处理引擎,具有强大且富有表现力的开发API,能够让数据工作者有效地执行流、机器学习或SQL,这些情况需要对数据集进行快速迭代访问。
与Python,R和SQL相比,很少有求职者具备这些技能。如果你会Hadoop和Spark的经验,那么你更有可能在求职中成功。
接下来是Java和SAS。我惊讶地发现在职位描述中,这两种语言出现的频率也很高。通常,Java和SAS在数据科学界的关注度都不高。
接下来是Tableau。这个分析平台和可视化工具功能强大,易于使用且越来越受欢迎。它有一个免费的公共版本,但如果你想保持数据私密就需要花钱。如果你不熟悉Tableau,那么强烈推荐Udemy的 Tableau 10 A-Z 。
下图技能列表显示的语言、框架和其他数据科学软件工具更多。
根据我们的分析和GlassDoor的调查,Python、R和SQL都是是最受欢迎的技能。根据局KDnuggets开发人员调查等分析显示,R语言、Hadoop、Java和SAS在近年来使用量呈下降趋势,Tableau呈明显的上升趋势。
3. 建议
根据这些分析的结果,以下是对数据科学家的一些建议。
-
证明自己的数据分析能力,并专注熟练掌握机器学习。
-
提高你的沟通技巧。推荐阅读《Made to Stick》这本书,帮助你提升自己观点的影响力。还可以试试Hemmingway Editor这款app,提高写作的逻辑性。
-
掌握深度学习框架。精通深度学习框架在机器学习方面越来越重要。
-
如果你在犹豫选择Python还是R语言之间做出选择,请选择Python。如果你数量掌握Python,那么可以也考虑学习R语言,这会让你在行业中更占优势。
当雇主在寻找具有Python技能的数据科学家时,他们也期望求职者掌握常见的Python数据科学库:numpy、pandas、scikit-learn和matplotlib。如果你在学习这些工具,建议你使用以下资源:
-
DataCamp,DataQuest
两者都是价格合理的在线SaaS数据科学教育产品,你可以在编程时学习,当中都教授了许多技术工具。
-
Data School
拥有各种资源,还包括一系列很赞的YouTube视频,解释各种数据科学概念。
-
McKinney,《Python for Data Analysis 》
本书注重pandas,还讨论了基础的numpy和scikit-learn等知识。
-
Müller,Guido《Introduction to Machine Leaning with Python》
Müller是scikit-learn的主要维护者。这是一本关于用scikit-learn学习机器学习的好书。
-
如果你想学习深度学习,我建议先学习Keras或FastAI,然后在学习TensorFlow或PyTorch。Chollet的《Deep Learning with Python》这本书是学习Keras的绝佳资源。
除此之外,我建议你了解你感兴趣的内容,尽管这里需要考虑到时间分配等因素。
版权声明:本文内容由互联网用户自发贡献,该文观点仅代表作者本人。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如发现本站有涉嫌抄袭侵权/违法违规的内容, 请发送邮件至 3561739510@qq.com 举报,一经查实,本站将立刻删除。
转载请注明来自专注SEO技术,教程,推广 - 8848SEO,本文标题:《网站数据分析师应该如何合理地分配时间,该掌握哪些技能(通用技能和技术技能介绍)》
标签:数据分析
- 搜索
- 最新文章
- 热门文章
-
- 如何使关键词搜索更精准?掌握哪些技巧可以提高搜索效率?
- 如何提升网站文章内容的质量度(掌握三大要素)
- 企业网络营销推广中的标题优化技巧(精准的标题,提升营销效果)
- 五种线上推广方法,让你轻松提升新站排名和获取流量(从SEO到社交媒体)
- SEO未来发展方向的趋势与展望(如何有效提高网站排名及流量)
- 如何优化图片SEO(8个技巧让图片在搜索引擎排名更靠前)
- 如何正确选择进行SEO优化(选择对网站SEO优化的重要性和技巧)
- 网站优化中的8要三不要(提高网站排名和流量的关键方法)
- 网站排名下降原因分析(揭示影响网站排名的因素及优化方法)
- 如何优化关键词以提升网站排名?详解SEO排名提升技巧?
- 完美SEO流量文章的写作技巧与实践
- 站内关键词如何优化?掌握这些技巧提升SEO效果
- 搜索引擎优化中影响比较大的主题因素(从多个维度解读影响搜索引擎优化的主题因素)
- 如何制定一份有效的SEO搜索引擎优化方案(探究SEO方案的设计与实施)
- 挖掘长尾的5个方法(从SEO)
- 淘宝SEO技巧和方法,助你打造热销店铺(从优化到流量提升)
- 从头到尾掌握优化的技巧(提升你的网站流量和排名)
- 企业网站SEO优化的10个细节(打造高效营销网站)
- 如何让网站内容差异化成为头筹之选(让你的网站脱颖而出)
- WordPress整站全面SEO优化指南(让你的网站更易搜)
- 热门tag