10.1_.jpg

 前言:本期文章是《我与数据打交道》系列的第三篇,也是最后一篇。后面几期文章的重心是神经网络,敬请关注。


小时候,我会经常听见大人们说:小孩怎么这么爱挑食?却很少有听说大人们也爱挑食,大概是因为大人们买的都是他们愿意吃的东西吧。


“己所不欲,勿施于人;己所之欲,慎施于人”。这句话的意思大概是,不要把自己主观上的想法强推给他人,反过来说,就是“己所之欲,亦施于人”,某些无良网站的某些无良广告大概就是奉行这条准则的吧。


只要有互动的地方,就会有推荐存在的合理性。现在越来越多的网站都在提供智能的推荐服务,例如宣称最关心用户的某新闻类APP就使用了智能推荐对读者推送其关心的头条新闻;某电商平台上浏览了一个物品以后,下方会出现你可能还喜欢的物品栏;在搜索框里输入“微信”两个字时,下方已经出现了一系列推荐词汇,如“微信网页版”,“微信公众号”等等。推荐似乎已经融入了互联网的各个角落,尽管目前来看,推荐的效果仍然是良莠不齐。不过,目光放远一点,搜索引擎的未来也许就是更加智能的推荐系统吧。


那什么是推荐系统呢?推荐是数据的产物,没有数据就没有推荐。推荐系统的工作原理通常分为两大类,内容过滤和协同过滤。下面以电商网站购物为例,谈谈二者的区别。


例如顾客A购买了商品1,如果商品2与商品1相似度非常高,那么推荐系统自然会想到把商品2推荐给顾客A。这就是基于内容过滤的推荐方法,重点关注的是商品本身,而非顾客。


再例如顾客A购买了商品1,顾客B购买了商品2,如果顾客A和顾客B在很多属性上相似度非常高,那么推荐系统自然会想到把商品2推荐给顾客A。这就是基于协同过滤的推荐方法,重点关注的是顾客本身,而非商品。


为了使得推荐系统更加智能化,通常会结合内容过滤和协同过滤一起使用。总之,就是说要想有一个优秀的推荐系统,需要同时考虑内容过滤和协同过滤。前几天有读者希望我推荐一些数据挖掘方面的资源,我考虑了一下,第一我可能不知道你以前偏爱哪种风格的书籍,第二我也不清楚你是否和我有一样的口味,于是我接下来的推荐所导致的资源浏览次数以及读者口碑满意度可能并不太理想了,不过还是尝试一下吧。


《Think Bayes》,这本书对贝叶斯理论讲得很详细,并且随书插入了相关的Python代码,适合一边学习,一边实践。


《Data Science From Scratch First Principles With Python》,这本书写得很入门,包含了数理统计知识、Python高级数据结构的使用、数据可视化,很实用的一本书。

《Machine learning A Probabilistic Perspective》,这本书无需介绍,数据挖掘的经典书籍。

《CS231n Convolutional Neural Network for Visual Recognition》,这是斯坦福大学的一门关于卷积神经网络在视觉识别中的应用,虽然标题强调了CNN,但是课程内容将近一半是讲了深度学习的基础原理与实践技巧,很实用。


以上是我看过的觉得挺有帮助的书籍,至于其他书籍,由于我还没认真看过,所以这里也不敢冒昧列出。


最后分享摘自著名作家余秋雨的书籍《千年一叹》中的金句:

• 干净的痛苦一定会沉淀,沉淀成悠闲,悠闲是痛苦的补偿,痛苦是悠闲的衬垫。


 
来源: 张泽旺 深度学习每日摘要
智造家