Yifei Kong

Dec 16, 2017

Google 关于Machine Leaning 的笔记

前几天看了 Google 的一个关于 Machine Learning 的slides,感觉不错,整理一下学习笔记

ML 的定义

An approach to achieve artificial intelligence through systems that can learn from experience to find patterns in that data

ML teaches a computer to recognise patterns by examples, rather than programming it with specific rules.

一个例子:

feature

一般来说,几个属性就代表了几个维度。

有时候更多的维度,更容易做出分类:参考这里

机器学习的分类

监督学习

数据是标注过的

无监督的学习

从没有标注的数据中学习

强化学习

通过带有激励的试错来学习

例子

线性回归(Linear Regression)

聚类

KNN

神经网络

fully-connected 神经网络

深度神经网络(DNN)

深度的意思就是有很多的层。比如说,对于人脸识别,其中某些层可能会识别出线条,然后有的层会识别出眼睛等等

卷积神经网络(CNN)

CNN 可以用来处理图片数据,以及可以表示为图片的数据。要确定一组数据可不可以表示为图片,可以尝试交换任意两行,或者任意两列,如果交换后对数据没有影响,那么就不可以被认为是图片数据。更多细节参看这个 Video

算法的分类

详细讲解请看这里

Regression

回归首先要有一个评价误差的方法,然后迭代的求出模型。回归是一类从统计中得出的方法,比如上面说到的 线性回归(用最小二乘法),还有逻辑回归等等。

Instance Based

Instance Based 是一个决策方法。通过相似度计算找出最接近的实例。比如KNN

Decision Tree

自定向下,做出决策

Bayesian

clustering

association rules

Artificial Neural Network

模拟人的神经系统,比如感知机

深度学习

其实就是很多层的神经网络,比如CNN

降维 (Dimensionality Reduction)

找到数据的内在属性,然后缩减维度,以便能够使用监督学习方法

还有一个ensemble没看懂

机器学习的输出

连续输出

比如拟合好的线性回归跟定一个数值,可以预测另一个数值

概率预测

分类

比如分辨出小猫小狗,或者是识别数字