8.1_.jpg


前言:公众号文章纯粹谈技术貌似不太好,一些复杂的公式也无法支持,插入图片看起来也并不美观,因此以后的文章主要以文字的形式谈谈技术以及感悟。本篇主要回顾一下我与数据分析有过的峥嵘岁月。那些年,为了赶工手抄版或电子版的实验报告插图、为了拿高分不得不让数据看起来更美观所用过的一些数据分析软件的心得体会。



    最近大家都在谈论大数据、信息爆炸等词语,的确,现在正处于信息蓬勃式发展、网络快餐式消费的时代,每天我们每个人为互联网所贡献的比特数至少数亿以上,面对庞大的数据资源,如何充分发掘它们的价值是当下机器学习的热门话题。作为一名普通的在校理工男,太大的数据量我是很难遇到的,我今天只想谈谈那些年,我与小数据打交道的过往点滴。



    回忆起刚刚几年前的时候,我拿到一份粗糙的实验数据,一脸茫然的样子,根本无从下手。还好,那个时候我的第一直觉就是使用Excel来帮助分析数据,当时使用Excel分析数据的好处就是简单粗暴,只要获得了想要的数据,无论是txt格式或者是csv格式,只需要一个按钮即可完美导入所有数据,然后下拉全选,只要熟悉了Excel的一些基本函数操作,对某行某列的数据分析显得如鱼得水了,算术运算、平均数、标准差、最值等等这些都是家常便饭了。
 
 
     当然,如果实验报告中只有光秃秃的几行公式以及统计数据,是不足以吸引老师的眼球的,为了博取高分,数据可视化是数据分析必不可少的亮点。谈起Excel的数据可视化,也就那么几种吧:条形图、柱状图、折线图、甚至三维图,这些图的做法都不难,勾勾就行了。不过,Excel作图有很多限制,一个图的很多属性是难以修改的,因此这种图往实验报告上一放就显得比较平庸甚至会被一些机智的老师嘲笑的。




    这个时候一个数据分析软件就派上用场了,那就是origin科学作图软件,origin与Excel最大的不同点就是它的功能十分庞大,不仅包括了各种统计学工具,而且使用它作出的图形也很美观,而且很多科研论文的图形甚至都是用origin作出来的,足以看出它的地位了。不过,我不太喜欢origin,虽然它功能强大,但是它始终是基于UI界面的,也就是说几乎所有的功能都是通过按钮来实现的,这种操作的优点是很具有人性化,基本上只要你眼睛睁大一点就不会错过某一个强大的功能;但是,从我一个程序员的角度来看,通过按钮操作的不具有可重复操作性,也就是每次作类似图我都要这样点来点去,效率不是很高。
 
 
    人工智能的目的不是消灭人类,而是把人类从纷繁复杂的重复劳动中解放出来,其实编程语言也可以看做一种人工智能,只要第一次写出了分析数据或科学作图的可运行的代码,往后很多重复的工作就可以避免了。



    放弃了学习origin,我便使用了MATLAB作为我的实验报告的主要利器。谈起MATLAB,可能很多人以为它是一个主打仿真的软件,其实不然,MATLAB英文全名是Matrix Laboratory,即矩阵实验室。所谓矩阵实验室,即它是一种线性代数的工具,那自然包括数据处理在内了,并且MATLAB可以作很多类型的图,既美观又富含信息量,一张图如果能做到美观又能传递非常多的信息就已经很成功了,的确,MATLAB可以做到这一点。并且,MATLAB与origin的最大不同之处是它是一种基于命令行的软件,它使用了自带了类似于C语言中一个MATLAB编程语言,任意操作都可以使用代码去表示,无论是数据分析还是科学作图,这样就使得代码的复用性很高,对于类似的操作不用重重复复去点来点去了。而且,MATLAB的用户群非常庞大,所以其社区交流互动非常活跃,遇到什么问题一般只要Google或Baidu一下就可以解决了。



    那么,是不是可以认为MATLAB是最好的数据分析软件呢?
 
 
 
 
 
来源:张泽旺 深度学习每日摘要
智造家