异常检测
分类:35体育备用网址 热度:

假设您有如下数据:
目前,鉴于新数据,它们被认为是正常的,因为它们被认为与原始数据没有太大差别。
下面显示的新数据被认为是不寻常的,因为它远非任何其他数据。
一般情况下
用于异常检测的训练数据集是正常/所有异常数据。
确定测试数据是否是异常数据
异常检测方法
基于未标记的测试数据的模型,以提供正常/异常数据的可能性(p(x))
然后,在模型中替换新数据并计算p(x)。它被定义为异常数据。p(x)∈定义为正常数据
异常检测的一个例子
欺诈检测:
x(i)是第i个用户的操作特性。
创建模型p(x)
使用p(x_new)来定义用户是否可能滥用。
在生产的情况下
监控数据中心计算机
x(i)是第i台计算机的特征
高斯分布(修订)
高斯分布
[N left({ mu,{ sigma ^ 2}} right)]
这种表示称为均值,称为标准差。
表征x遵循高斯分布。
[x sim N left({ mu,{ sigma ^ 2}} right)]
他说
给定数据和已知数据x遵循高斯分布(N(,2))
[ begin{array}{l} left {{^{ left(1 right)}},{x ^{ left(2 right)}}。
end{array}{x ^{ left(m right)}}} right } {x ^{ left(1 right)}}]
由以下等式计算
[ begin{array}{l} mu = frac{1}{m} sum limits_{i = 1}^ n{{x ^{ left(i right)}}} { sigma ^ 2}= frac{1}{m} sum limits_{i = 1}^ m{{{{left{{left{i right}}}- mu}))右)}^ 2}} end{array}]
注意:在数学中,已经确定使用m-1作为分母,但是在机器学习中m通常用作分母。由于数据量很大,影响不大。
我有以下数据集
[ begin{array}{l} left {{^{ left(1 right)}},{x ^{ left(2 right)}}。
{X ^{ left(m right)}}{right } x{R ^ n}{={x ^{ left(i right)}}= left{{x ^ ^{ left(i right)},x_2 ^{{left(i right)}。
X_n ^{ left(i right)}} right) end{array}]
假设数据的每个属性都遵循高斯分布(如果不满足,请参阅下面的“特征处理”部分)。
[ begin{array}{l}{x_1} simN left({{ mu _1}, sigma _1 ^ 2} right) {x_2} sim N left({{ mu _2}, sigma_3^ 2} right)
\。
\{x_n} simN left({{ mu_n}, sigma_n ^ 2} right) end{array}]
接下来我们定义模型p(x)。
[p left(x right)= p left({{x_1};{ mu_1}, sigma_1 ^ 2} right)p left({{x_2};{ mu_2}, sigma_2 ^2} right) cdot cdot cdotp left({{x_n};?{Mu_n}, sigma_n ^ 2} right)]

[p left(x right)= prod limits_{j = 1}^ n{p left({{x_j};{ mu_j}, sigma_j ^ 2} right)}]
在这里,我们假设因子彼此独立(即使它们不相同,模型也能很好地工作)。
算法流程
1.选择您认为可以表示异常示例的函数x
2.计算模型1参数。
n,12
N2
[\{{{{}}{}{}}}Sigma_j ^ 2 = frac{1}{m} sum limits _{i = 1}^ m{{{ left({x ^ j{{left(i right))}- ??{ Mu_j}}正确)}^ 2}} end{array}]
3,计算新数据的p(x)
[p left(x right)= prod limits_{j = 1}^ n{p left({{x_j};{ mu_j}, sigma_j ^ 2} right)}= prod 限制_{j = 1}^ n{ frac{1}{{sqrt{2 pi}{ sigma_j}}} exp left({ - frac{{{{{{{{{{{{{{{{{{{ mu_j}} right)}^ 2}}{{2 sigma_j ^ 2}}} right)}]
4(当p(x)是ε时)。定义为例外
如何评估异常检测结果
虽然可能无法监控异常检测,但可以假设标记数据可用于评估模型性能。
案件
在飞机发动机的例子中,
10000个好的电机样品
20个样品来品尝发动机。


上一篇:[方头创伤占用面积] 下一篇:没有了
热门排行
精彩图文
  • [照片]拍摄吉利博瑞GE的真实照片,让突破生效!
    [照片]拍摄吉利博瑞GE的真实照片,让突破生效!
    今天,吉利博瑞(2015年4月9日出版)已上市三年。2017年,它改变了。仅用每月售出4,000个单位来解释博瑞品牌是不够的。 ?成熟的设计和丰富的层次构成吸
  • [中国帕霸]广西明达网络科技有限公司北海分公司
    [中国帕霸]广西明达网络科技有限公司北海分公司
    北海 无限体验没有次要年龄限制 工作职责: 它主要负责公司的业务计划,结合合同签订地区的所有法律事务,改善客户信息和售后服务,积极配合公司的
  • 原创折纸粉色大全PT粉色纸折叠图教程
    原创折纸粉色大全PT粉色纸折叠图教程
    原创折纸粉色大全PT粉色纸折叠图教程 折纸玫瑰大泉最着名的是川崎纸玫瑰,福山纸玫瑰和PT纸玫瑰,这是熟悉的理光玫瑰。 折叠Fuchao Rose的方式在过去曾
  • 原创,翻译和赞赏邱秋兰。
    原创,翻译和赞赏邱秋兰。
    Nagashira:它指的是大片森林和广阔的森林。 浪费:这太荒谬了。 神圣的态度:这是一个美丽而美丽的姿态。 有趣:在这里,我有一种恶心和溢出感。 每句
  • 定制河南广告伞
    定制河南广告伞
    河南大型广告伞的定制野心是一种铝合金材料。合金管连接支柱的成本不仅高强度,而且重量轻,弹性好。它是一种铝制航空航天支柱,已达到各种指标的
  • Nha Trang有多少现金足够?
    Nha Trang有多少现金足够?
    相关出版物 12日深夜蜜月之旅?中世纪欧洲花园自动驾车游览克罗地亚,游戏结束时使用正确的猎蛋 【后半生命】首次访问●台湾 黄金时代 - 北海道美食
  • Sony xperiaxzpremium怎么样?索尼xperiaxzpremium配置参数
    Sony xperiaxzpremium怎么样?索尼xperiaxzpremium配置参数
    索尼是一家世界级的大型综合性跨国集团企业。与此同时,索尼还是视听,视频游戏,通信产品和信息技术的全球领导者。便携式数字产品的第一个先驱和