跳到主要内容

后续内容提要

关于实用

能够看到这里的朋友,大概已经明白了数据分析要做什么事情,在什么步骤最花时间,问题要问成什么标准才算合格,以及最好以一种什么样的步骤去解决问题。任何人都没有办法替我们问出合适的问题,或者在通向正解的道路上作出合适的思考与判断。不过在这里可以在工具层面向你介绍加速解决问题的试验过程(也即在 上一节中介绍的第 4 步)。

本系列原来是考虑叫实用数据分析的,但此名称被注册了,于是叫了数据分析指北。从原来设想的名字大概也能窥到本系列的主旨思想"和外面的妖艳贱货不一样",就是实用

实用意味着少一些理论。少一些并不意味着不需要,相反,理论很重要,不过需要我们自己把关以及补课。很幸运的生在这个时代,学习资料已经极大丰富化,只要想学点什么,我们还是能在网络上找到不少资料的。

实用意味着,本系列有些内容(比如后面会介绍的图表生成,自动文档生成等)并不适用于最终呈现给我们的观众(比如朋友,领导,同事等),还需要你自己去做一些美化和调整。尽管在我等有着"内容大于形式"思想的人看来已经 good enough(足够好)了。

实用也意味着,我们不会覆盖所有的内容和细节,只会覆盖我认为比较重要的部分。也期望你能够从这种 80/20 的介绍原则中,吸收到养分。

关于下一步内容

下一步会先介绍一下整个数据分析之前要做的工作及这部分工作的重要性。 因为有些朋友只用过Excel,所以,之后我们会大概介绍下SQL。 接着会介绍一下整个数据分析中重点使用的神器 -- KNIME 的一些操作,基础节点的使用要点、循环结构、错误处理方法、数据可视化、模块化、机器学习、Python 和一点点的 Java. 最后, 还会简要介绍深度学习、时间序列分析、扩展开发、KNIME Server 等内容.