被挤爆的数据科学行业!五年前“最性感的职业”怎么了?
前文我们谈论过如何学习SQL的问题,当你使用SQL的时候,你会有这样一个疑问,这样的数据库处理软件,它是不是一个编程语言呢?答案是肯定的,不过它属于声明式编程。你可以指定所需要的输出(就是你想从数据表中把哪几列提取出来),但没法控制它用什么方式把结果反馈。SQL抽象出大量发生在数据库内的信息。 与之相对的,如果你需要一种可以指定数据从哪里、用什么方式被选取出来。像Java、Python、Scala、R、Go等等这些都是现在流行的面向对象的过程化语言。 大家现在对用哪种语言去做数据科学依旧有很多争论,当然也不会在这里指定一种语言是最合适的。但我想说的是,在我的日常工作中,Python对我的帮助真的很大。作为一个初学者来说,Python很容易上手,而且也是数据领域里最流行的编程语言。为什么这么说呢,因为它可以处理很多数据问题,如构建一个模型放入到scikitlearn里、访问AWS API云平台服务接口、制作网页服务应用、清洗数据、创建深度学习模型等等。而在统计领域里,R还是更为广泛使用。 但同样的,我还是建议不用去深究统计领域,Python基本可以满足编程需求了。 当然Python在大规模应用、打包依赖关系、一些特定数字处理、特别是时间序列和R那样开包即用(Python不像R有很多成型的功能包、更细致的统计功能模型) 等等问题上也不是很适用。 (编辑:无锡站长网) 【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容! |