ASP源码.NET源码PHP源码JSP源码JAVA源码DELPHI源码PB源码VC源码VB源码Android源码
当前位置:首页 >> 网络编程 >> Python教程 >> python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求

python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求(1/2)

来源:网络整理     时间:2017-12-07     关键词:

本篇文章主要介绍了" python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求",主要涉及到方面的内容,对于Python教程感兴趣的同学可以参考一下:   终于盼来了不是前言部分的前言,相当于杂谈,算得上闲扯,我觉得很多东西都是在闲扯中感悟的,比如需求这东西,一个人只有跟自己沟通好了,总结出某些东西了,才能更好...

  终于盼来了不是前言部分的前言,相当于杂谈,算得上闲扯,我觉得很多东西都是在闲扯中感悟的,比如需求这东西,一个人只有跟自己沟通好了,总结出某些东西了,才能更好的和别人去聊,去说。

  今天这篇写的是明白需求,其实更多的是想和大家聊天,只有把这个聊开了,后面的东西做起来才有意义,才有价值,在聊天中,思考中发现价值(化身为话唠了?)

  有时候你自以为某些东西很重要,其实那只是站在自己的角度觉得很重要,更需要的是站在别人,站在市场的角度去思考这个问题,特么的到底重不重要。

  需求我觉得可以分为两类:自己主动去做的和别人要求你去做的。别人要求你做的,你完成的很快,大部分人都是走走肾就能搞定。但是自己主动去做的,我觉得没人会只走肾不走心的。 当你真正主动去做一件事的时候,那件事才能带来价值,不然对你来说无非就是浪费时间浪费生命浪费撩妹的好时光,可是人生不就是用来浪费的吗?(好矛盾)

 

感悟一:做数据相关的工作,如果只是一味被动的去出一些数据报表,完成一些没有自己想法的数据报告,不带有任何感情色彩去做,不把自己的想法和思维附在那一堆枯燥的数据上,那终究是一件浪费时间浪费生命浪费撩妹的好时光的工作。如果给一家企业这么干活,永远只会是人手,不会成为人才,最终可能会发展成为奇葩。

  所以,对待需求,不能只走肾,不走心~ 去挖掘,去发现,去好奇,去探索,去尝试着犯错。主动给自己揽活干,把被动变主动,养成了主动的习惯,不仅仅只对你手头的工作有好处,对整个人的思维都是有帮助的,这是一辈子的事。只有去不断思考了,需求才会出来。

  说个真事儿,年初的时候总监让我出报表,需求就是:一周起码要产出5张新数据报表。如果是你,你会怎么做呢?

  我还真那么去做了,几周下来,居然好神奇的出了几十张数据报表,后来我发现不对劲,出了这么多数据报表,意义何在?除了走量,好像然并卵啊。呵呵,我承认我走肾了。

 

感悟二:搞数据,最重要的不是你使用什么工具,而是你的数据思维,让手上的数据产生价值。武功再高,也怕菜刀。你用excel 计算 1+1 和 python 计算 1+1 ,都是等于2。具体使用什么工具,你得看自己手上的需求和数据规模,几千上万的数据,就别来问用什么工具了,你玩得溜,用excel照样切菜。

  举个例子:现在手上有一客户基本信息数据(user表),给他们按区域统计一下人数。

 python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求

    2W条的量:excel透视表一下,就行了,你说你要搞个hadoop来跑2W量的数据,why not?

 python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求 python 抓取金融数据,pandas进行数据分析并可视化系列 明白需求

    10W条的量:用excel就吃力了,用sql是ok的 (select area as '区域',count(area) as '人数' from user group by area)

    100W条的量:用python的pandas库就好了 (user.area.value_counts())

    1000W以上的量:pandas可以做,但是分布式的做起来就更ok了。

相关图片

相关文章