andrew ng
Andrew Ng Machine Learning 第九周
- 前言
- 异常检测
- 推荐系统
- 题目
- 1.Question 1
- 2.Question 2
- 3.Question 3
- 4.Question 4
- 5.Question 5
- 6.Question 6
- 7.Question 7
- 8.Question 8
- 9.Question 9
- 10.Question 10
前言
网易云课堂(双语字幕,不卡):https://study.163.com/course/courseMain.htm?courseId=1004570029
Coursera:https://www.coursera.org/learn/machine-learning
本人初学者,先在网易云课堂上看网课,再去Coursera上做作业,开博客以记录,文章中引用图片皆为课程中所截。
异常检测
1.目标动机
Tips:判断新的xtest是否是异常数据
Tips:由现有的训练集拟合出一个p(x)模型,将p(xtest)代入模型,将结果与ε对比,若小于ε,即说明新的点落在该模型的概率过小,即为异常
2.高斯分布(正态分布)
3.算法
Tips:假设p(x)拟合为高斯分布
Tips:对于每个特征x,求出相应的高斯分布参数μ和σ,最后将每个p(xi)相乘,得出最后的p(x)
4.开发和评估异常检测
Tips:以上为假设情况,假设分配情况如上
Tips:在训练集上模型p(x),在交叉集或者测试集上测试当前p(x)情况
Tips:评估方法在第六周笔记,同样ε也用这种方法来决定
5.异常检测VS监督学习
Tips:简单来说,异常检测情况是当正样本很少负样本很大的时候或者出现异常的情况很多的时候使用
6.选择要使用的功能
(1)特征高斯化
(2)误差分析
Tips:用从训练集中得到的p(x)去在交叉集上验证,将其中验证有误差的样本人为的挑选出来,并且根据特征判断出是否应该有新的特征
7.多变量高斯分布
Tips:简单来说,本来cpu Load和Memory Use应该是线性关系,所以我们需要的数据模型p(x)应该是个椭圆,可是按照上述方法,p(x)所拟合的永远会是一种圆形,则无法判断出它的异常性
8.使用多变量高斯分布的异常检测
推荐系统
1.问题规划
Tips:很常见的网站自动推荐的问题。这里nμ=4,nm=5,r(1,1)=1,r(3,1)=0。问题就是通过大量的r(i,j)和y(i,j)去判断那些没有评价的电影的星级来进行电影推荐
2.基于内容的推荐算法
Tips:假设对于每部电影都创建两个特征值,并且向量化,即对于第一部电影有特征向量x(1)=(1,0.9,0),此处1为截距特征,然后把这个系统当作一个线性回归问题
Tips:为了判断用户j对某个没评价电影的评分,假设学习一个θ向量来计算评分
Tips:为了学习θ,定义了相应的代价函数,为了训练出参数θ,即 文章目录前言Gatling使用理由性能测试性能测试是什么意思?编写测试场景,自动化测试分析并调查您的应用程序的瓶颈安装准备工作Java Java开发者如何正确的使用String,StringBuffer,StringBu 通过前面的文章,我们知道String类最大的特点是不可变性,这意味着对String类的任何修改都会新生成一个字符串,比如你执行了String类的 一、前言我国的医院信息化建设,始于上世纪80年代中末期,经过90年代的自由繁荣(ye man)发展和本世纪初的政策扶持、引导规范与市场培育 java.lang.AbstractMethodError: null 在使用springcloud的时候运行报这个错,原因是版本冲突导致的,在idea中创建springcloud项目的时候,这里默认是${spring-cloud.vers Machine Learning学习笔记(七)粒子群优化算法 粒子群优化算法( PARTICAL SWARMS OPTIMIZATION)
粒子群优化,是除了蚁群算法,鱼群算法之外的一种群体智能的优化算法,源自对鸟类捕相关阅读