很多人问机器学习领域要入门推荐什么书。在我看来,无论做什么,都要找准最短路径,所谓最短路径,就是连通几个核心概念和技能的耗时最短的一个流程。找到了最短的流程,就能以最少的时间为之后进一步的学习打下坚实的基础,之后无论专供机器学习的某一个子领域,都不会在核心概念上犯浑。
那么机器学习领域有那些核心技能了?首先是方法论,其次是常用的模型及其背后的统计原理,最低的一层是常用的算法包。方法论是说我们怎么评价模型,有那些可以加速学习和避免过拟合的trick,常用的模型包括SVM,随机森林,贝叶斯网络,人工神经网络等,学习算法包的目的是为了让读者有亲身的体验,从而对方法和模型有切身的了解。
因此,对于想认真学习机器学习课程的童鞋,这里推荐两条最短路径,如果你只关心分类任务,即有监督的学习,那么可以推荐一个4周的coursera 课程 Practical Machine Learning,这门课程涵盖了上文说的所有三个点,英语授课,对数学基础要求不高,每周视频时间1个半小时,课程后有编程作业,预期每周花一天时间,可以在一月内学完。
对于英语不好的童鞋,推荐的课程是台湾大学 林軒田 机器学习基石 (Machine Learning Foundations) 和其姐妹篇台湾大学 林軒田 机器学习技法(Machine Learning Techniques)该课程在课程图谱上的评价很高,10条评价全是五星,而且评论都很精彩。据说林老师现在创业去了,这门课说不定也会成为绝版,赶紧收藏吧,这两门课难度较大,需要一点的数学基础,课程时间也较长,两门课加起来需要16周的时间,但是涵盖面更加广泛,包含了目前常用的模型,如人工神经网络。
链接: http://pan.baidu.com/s/1hsmAsNq 密码: kxfj
链接: http://pan.baidu.com/s/1bpHSAPD 密码: abye
另外推荐几本书相关的书籍,这里推荐的书籍除了第一本是很简单的,其他都是有一点挑战,阅读起来需要花一些功夫去思考的书籍,只有看这样的书籍,才能让你的学习过程先苦后甜。
这是一本扫盲的书,用合大量案例与漫画,将高度抽象的数学、算法与应用,与现实生活中的案例和事件一一做了关联,这本书不会教会你任何实际可用的方法,但却可以让你在谈论起机器学习相关的话题时不再迷茫。
这两本书讲了机器学习在多个领域具体应用的案例,例如,图像识别,自然语言处理,股票市场预测,社交网络分析,网站访问量回归预测,基于相似度的聚类,邮件智能垃圾邮件识别,密码破译。对于喜欢通过案例学习的童鞋,这两本书值得细读,对于想知道机器学习如何改变我们日常生活并预测其未来影响的童鞋,了解基础的方法有助于做出准确的预测。
再所有推荐的书中,我觉得这本书是性价比最高的。这本书适合有一定基础的读者去看,检验自己是否理解一个方法的有效办法是看你能否用图形化的语言去将其表示出来,能否看懂这本书,可以用来复习并加深自己的理解。书中包含可执行的代码,没有装付费Matlab的童鞋可以试试免费的Octave,在上面一个个运行下这些代码,这本不厚的书可以读的很厚。
机器学习是一个很依赖数学基础的学科,没有学好概率论和线性代数,你就不会看懂那些方法背后的原理。这两本书是专门为那些数学基础不好的童鞋也最短的方式补课的。不过,数学总归是抽象的,是需要花整段的时间去投入的,所以这两本书也不是简单的书。
↧