AI入门指南大全
最近笔者身边越来越多,无论是不是计算机专业的人,都开始接触人工智能了。
笔者有一年多的AI自学经验,学过几门课程、看过几本书、参加过一些比赛和项目,在这里做一个AI入门大全,希望可以解决萌新不知从何入门的难题。
1. 学什么?机器学习还是深度学习
笔者曾在何为AI中,介绍了人工智能,机器学习和深度学习的区别。
总的来说,机器学习是人工智能的一种实现方法,深度学习是机器学习的一个分支。
不过当我们平时谈及机器学习和深度学习的时候,我们常常用机器学习指传统的统计学习方法,而深度学习指使用神经网络的方法。
1.1 机器学习
机器学习是用统计学的方法,来实现数据预测、分类等问题。
常见的使用场景有:商品推荐,个人信用评估,量化金融,医疗、交通领域大数据等等。
常用的算法有:线性回归,SVM,朴素贝叶斯,决策树,模型集成等等。
机器学习很数学,很统计学。当你学习朴素贝叶斯、SVM这样的机器学习经典算法的时候就会理解数学的重要性。
除此之外,机器学习还需要有对数据有很强的敏感度。尤其是当你参加和机器学习有关的比赛和项目的时候,在做清洗数据、特征工程的时候,对数据的分析尤为重要。
有一句流传很广的话:数据和特征决定了机器学习的上限,而模型和算法只是逼近这个上限而已。可见对数据敏感是很重要的能力。
1.2 深度学习
深度学习是用神经网络的方法,来解决计算机视觉,自然语言处理等问题。
常见的使用场景有:人脸识别,文本识别,文本翻译,语音转文本,客服机器人等等。
最基本的模型分类有:CNN,RNN等。
目前大部分萌新都是从深度学习开始入门。读者若是不知从机器学习还是深度学习学起的话,笔者建议先学深度学习。
深度学习需要数据量远远大于传统的机器学习,常常是用来解决视觉或语言方面的问题。
除此了用统计学和神经网络这两个主流的人工智能实现方法,还有强化学习。不过这对新人来说直接入门过难,还是不要考虑了。
至于要从机器学习还是深度学习开始入门,就要看个人的需求了。
2. 机器学习入门指南
机器学习主流语言为python/R/matlab。常用的python库有pandas,sklearn和matplotlib。
2.1 机器学习算法入门
笔者当时是看书籍入门的。推荐《统计学习方法》、《机器学习实战》、《机器学习》(俗称西瓜书)。
耐心看完《统计学习方法》和《机器学习实战》前80%的部分就可以开始比赛了。
2.2 机器学习实战建议
记住,学会算法和应用算法是两回事!
在学习算法时我们会学习线性回归,SVM,决策树等等。但真正做项目的时候,我们面对的问题会复杂很多。
也许数据有残缺,有错误,我们需要清洗数据(使用pandas)
获得了合格的数据后,我们需要查看数据的分布(使用matplotlib等绘图工具),做特征工程,提取特征。
获得了特征后,我们可以应用机器学习算法了(使用sklearn机器学习算法库)
应用算法后,我们还需要评估我们的算法效果如何,要用到准确率、召回率、F1等等指标。同时还要考虑模型有没有过拟合。
在获得了模型的各类指标后,我们需要不断调整模型,提高模型的效果。可能会需要模型集成、重新筛选特征……
这一系列步骤需要大量的实战练习,仅仅知道几个经典的机器学习算法是远远不够的。推荐去kaggle或阿里天池上做些和数据挖掘的比赛。
3. 深度学习入门指南
深度学习目前主流为python,主流框架为tensorflow和pytorch。
视频课程推荐吴恩达的DeepLearning课程,课程内容十分详细。五门大课,从基础知识、卷积网络、RNN网络、项目实现等多个角度,循序渐进讲解深度学习入门的方方面面,同时有配套的练习代码。
网易和其有合作,在网易云课堂上有中文字幕的视频。英语不好的同学可以直接在这里上学习就行了。
DeepLearning课程资料
- 视频:Coursera(付费内容,内含作业) | 网易云课堂(官方授权,无作业)
- 代码:课件+作业(盗版资源) 作业运行环境见环境安装
深度学习进阶内容
学习完后可根据个人的需求,选择指定领域深入学习。
- 图像领域 CS231N
- 自然语言处理 CS224N
- 强化学习 CS294-122
书目建议购买《深度学习》,俗称花书。(电子版:
英文原版 | 中文版 )
同时,建议读者逛一逛kaggle或阿里天池,做些与深度学习相关的比赛。
4. 学习建议
4.1 网上两千块的人工智能专业课值得学吗?
曾有朋友向我吐槽,目前人工智能最大的赚钱项目就是开付费课程教其他人人工智能。
的确,网络上以某云课堂和某学城为代表的平台提供的人工智能专业课,宣称为专业从业人士指导,往届学员多数入职大公司。至于课程价格,则在2000+。
笔者认为,买这类课程完全没必要!
网络上免费的优质课程质量并不差。笔者自学数月后,看其付费课程所提供的教学大纲,感觉自己可以讲授绝大部分内容。
至于付费课程宣传的一起做实战项目,读者平时逛逛kaggle和阿里天池,实战项目不愁做。
还有那宣传的“便捷的在线项目实战平台”,完全就是在线的jupyter,读者按着笔者以前写过的python环境安装教程,就可以在自己电脑上配置一个运行环境。
4.2 作为学生,AI入门差不多了该做什么
可去 kaggle或阿里天池上做一下新手比赛,如kaggle上的Titanic(机器学习)或者Digit Recognizer(深度学习)。在暑假的时候欢迎报名Deecamp。
若参加了一些比赛且实力不错,可以直接向今日头条等公司投递实习简历。在假期的时候在AI公司实习两个月,无论是对实力还是以后的出路,都是很有帮助的。
4.3 学会了可以做什么?
机器学习可以在金融公司、保险公司等充满数据且数据信息很复杂的领域做数据挖掘,即找出数据之间潜在的有价值的关系。
而深度学习则可进入相关领域的大公司或创业公司,从事图像识别、自然语言处理等领域的问题。
4.4 学习资料大全
更多学习资料可见:人工智能学习清单
One thought on “AI入门指南大全”