首页 \ 问答 \ 关于adaboost算法(About adaboost algorithm)

关于adaboost算法(About adaboost algorithm)

我正在进行交通流预测,在那里我可以预测一个地方交通繁忙或交通繁忙。 我将每个流量分类为1-5,1是最轻的流量,5是最重的流量。

我来到这个网站http://www.waset.org/journals/waset/v25/v25-36.pdf,AdaBoost算法,我真的很难学习这个算法。 特别是在S是集合的部分(( xiyi ), i=(1,2,…,m) )。 其中Y={-1,+1} 。 什么是xy和常数LL的价值是多少?

有人能解释一下这个算法吗? :)


I'm working on a traffic flow prediction where I can predict that a place has heavy or light traffic. I have classified each traffic as 1-5, 1 being the lightest traffic and 5 being the heaviest traffic.

I came across to this website http://www.waset.org/journals/waset/v25/v25-36.pdf, AdaBoost algorithm, and I'm really having a difficulty learning this algorithm. Specially in the part where S is the set ((xi, yi), i=(1,2,…,m)). where Y={-1,+1}. What are x, y and the constant L? what is the value of L?

Can someone explain me this algorithm? :)


原文:https://stackoverflow.com/questions/11825493
更新时间:2020-11-03 09:11

最满意答案

S={(x1,y1),...,(xm,ym)} :每个(x,y)对是用于训练(或测试)分类器的样本:

  • x =描述此特定样本的特征,例如列出amount of cars on the road day of the week等的值
  • y =特定x的标签,在您的情况下可以是1, 2, 3, 4 or 5

Table 1显示了他们使用的x功能,即: DAYTIMEINTDETLINKPOSGREDISVOLOCC 。 表格的最后一列显示标签( y ),它们设置为1-1 (即, yesno )。 表中的每一行都是1个样本。

L是AdaBoost训练弱学习者的轮数(在Random Forests中用作弱分类器)。 如果你将L设置为1则AdaBoost将运行1轮,并且仅训练1个弱分类器,这将产生不良结果。 使用L不同值执行多个实验以找到最佳值(即,当AdaBoost收敛或开始过度拟合时)。


S={(x1,y1),...,(xm,ym)}: Every (x,y) pair is a sample used for training (or testing) your classifier:

  • x = The features which describe this particular sample, for example values which list the amount of cars on the road, day of the week, etc
  • y = The label for a particular x, which in your case can be 1, 2, 3, 4 or 5

Table 1 in the paper shows the x features they used , namely: DAY, TIME, INT, DET, LINK, POS, GRE, DIS, VOL and OCC. The last column of the table shows the label (y), which they set to either 1 or -1 (i.e., yes or no). Every row in the table is 1 sample.

L is the amount of rounds in which AdaBoost trains a weak learner (in the paper Random Forests is used as the weak classifier). If you set L to 1 then AdaBoost will run 1 round and only 1 weak classifier will be trained, which will have bad results. Perform multiple experiments with different values for L to find the optimal value (i.e., when AdaBoost is converged or when it starts to overfit).

2012-08-06

相关问答

更多

用于MATLAB的多标签AdaBoost(Multilabel AdaBoost for MATLAB)

您可以使用支持向量机中使用的相同方法。 支持向量机最初是二元分类器,提出了几种处理多类数据的方法: 一对一 :为每个班级构建一个二元分类器,并将本类中的实例作为正例进行训练,将所有其他实例作为负例进行训练(即:1 vs vs not1,2 vs vs not2,3 vs vs3 )。 最后使用每个分类器的后验概率来预测类别。 一对一 :通过简单地训练两个类的实例,为每对类(即:1-vs-2,1-vs-3,2-vs-3,...)构造几个二进制分类器。 然后,您可以使用多数投票结合个人结果。 误差校正 ...

AdaBoost ML算法的python实现(AdaBoost ML algorithm python implementation)

看起来好像sdpy项目有一个AdaBoost实现。 特别看一下sdpy/cs/ml/cla/boosting.py文件。 也许你可以从那里获得一些动力。 Thanks a million Steve! In fact, your suggestion had some compatibility issues with MacOSX (a particular library was incompatible with the system) BUT it helped me find out a ...

用于C#的机器学习分类器AdaBoost(Machine Learning classifier AdaBoost for C#)

OpenCV支持AdaBoost(Discrete,Real,Logit和Gentle)的基本风格。 这个库是用C / C ++ 编写的,但你可以使用名为Emgu CV的C#包装器,尽管API比C / C ++更受限制(主要是Train()和Predict()方法)。 您也可以使用Accord.Net,但我还没有尝试过。 OpenCV supports the basic flavors of AdaBoost (Discrete, Real, Logit and Gentle). This li ...

使用Adaboost选择要素向量中的最佳要素(Selecting Best Features in a feature vector using Adaboost)

在某些情况下,Adaboost中的弱分类器(几乎)等于特征。 换句话说,使用单个特征进行分类可以比随机性能略好,因此可以用作弱分类器。 给定训练数据,Adaboost将找到最佳弱分类器集,因此如果弱分类器等于特征,那么您将获得最有用的特征的指示。 类似特征的弱分类器的示例是决策树桩 。 In some cases the weak classifiers in Adaboost are (almost) equal to features. In other words, using a sing ...

weka AdaBoost不会改善结果(weka AdaBoost does not improve results)

AdaBoost是一个二元/二分类/二类分类器,旨在提升弱于1/2准确度的学习者。 AdaBoostM1是M级分类器,但仍需要弱学习者比1/2准确度更好,当人们期望机会水平在1 / M左右时。 平衡/加权用于最初获得平等的流行类别,但AdaBoost固有的重新加权可以快速消除这种情况。 一个解决方案是基于提高机会纠正措施,如Kappa或Informedness(AdaBook)。 随着M增长,例如使用文本分类,这种不匹配会增加,因此比机会分类器更加强大。 因此,在M = 100的情况下,AdaBo ...

Adaboost算法及其在人脸检测中的应用(Adaboost algorithm and its usage in face detection)

Adaboost是类分类算法,它使用弱分类器(任何能够提供超过50%正确结果的东西,比随机更好)。 最后将它们结合在一个强分类器中。 训练阶段找到计算H(最终结果)的阿尔法变量。 H =Σ(α(i)* h(i))使得对于两类问题h(i)为1或零。 看来H是所有弱特征的加权和,所以当我们有一个新的输入(之前没有看到过)时,我们应用弱分类器h(i)并将它们与我们从训练阶段得到的正确的alpha相乘以得到一个或零。 有关更多说明,请参阅gigapeida.com网站上的“数据挖掘中十大算法”一书。 Ad ...

Adaboost与神经网络(Adaboost with neural networks)

提升总结: 1-使用训练数据训练您的第一个弱分类器 2-第一个训练有素的分类器会对某些样本产生错误并对其他样本进行正确分类 增加错误分类样品的重量并减少正确样品的重量。 用这些权重重新分类您的分类器以获得您的第二个分类器。 在你的情况下,你首先必须用这些更新后的权重对数据进行重新取样,创建一个新的训练数据,然后通过这些新数据训练分类器。 3-重复第2步T次,在每轮结束时,根据公式计算分类器的α重量。 4-最后的分类器是T分类器决策的加权总和。 从这个解释中可以清楚地看出,你做错了。 而不是用新的数 ...

Adaboost如何使用Viola和Jones算法?(How Does Adaboost Work with Viola and Jones Algorithm?)

应该更快地回答我自己的问题,但我忘了它。 这是我的计算机科学学院的一个项目,所以我可以提供答案。 当你理解Adaboost时,Adaboost其实很简单。 首先,您需要检测基底中每幅图像的内部特征(我们使用了4000个图像来制作一个较大的图像),如果您有足够的内存或在程序中需要时处理它们,则可以将它们存储起来。 对于里面有5个haar特性的4000张图像,我们使用了超过16Gb的RAM(代码是用c编写的,但没有内存泄漏,它是双精度数组) 训练算法为图像分配权重。 该权重表示算法难以做出好的预测(面 ...

Adaboost和前进阶段性加法建模(Adaboost and forward stagewise additive modeling)

考虑一个最简单的例子,您可以使用线性模型拟合一维曲线。 您将学习曲线,而不是近似。 所以每次你拿起两个数据集来学习穿越它们的线。 经过充足的学习时间后,将通过平均您学习的所有参数(权重)来获得该线。 这样的线将实现最低的样本内错误。 这相当于在给定新训练集的情况下更新先前参数的学习过程。 我不确定我是否正确理解你的问题,但是如果你试图适应上面例子的不同模型(线性,二次,三次,指数......),每个模型的权重数量是不一样的。 因此,人们在分类问题中所做的贪婪方法可能不太合适。 一种解决方法可能是: ...

关于adaboost算法(About adaboost algorithm)

S={(x1,y1),...,(xm,ym)} :每个(x,y)对是用于训练(或测试)分类器的样本: x =描述此特定样本的特征,例如列出amount of cars on the road day of the week等的值 y =特定x的标签,在您的情况下可以是1, 2, 3, 4 or 5 Table 1显示了他们使用的x功能,即: DAY , TIME , INT , DET , LINK , POS , GRE , DIS , VOL和OCC 。 表格的最后一列显示标签( y ),它们 ...

相关文章

更多

最新问答

更多
  • 如何保护Solr只允许SELECT请求给用户并禁止其他任何东西?(How to secure Solr to allow SELECT request to only users and disallow anything else?)
  • XPath表达式无效/错误TFHpple SWIFT 1.2(XPath Expression not working/incorrect TFHpple SWIFT 1.2)
  • css3 3D变换不能平滑地制作动画(css3 3D transform doesn't animate smoothly)
  • 运行时错误'91'和Outlook.Application = <对象变量或没有设置块变量>?(Run-time error '91' & Outlook.Application = Object variable or With block variable not set?)
  • 慢的webservice问题(Slow webservice problem)
  • textview的不正确对齐方式(Improper alignment of a textview)
  • 在第一步“Hello World”中出现Java错误(Cannot run “Hello World” program in Eclipse)
  • 为什么十六进制地址是14个字符?(why the hex address is 14 character?)
  • 如何在Python中的不同类中使用变量?(How to use variable in different classes in Python?)
  • asp:GridView HYPERLINKFIELD - datanavigateurlformatstring中的asp代码(asp:GridView HYPERLINKFIELD - asp code inside datanavigateurlformatstring)
  • 关于adaboost算法(About adaboost algorithm)
  • 在Matlab上内置图像(Built in Images on Matlab)
  • java swing:输入键事件时焦点丢失(java swing: Focus lost on enter key event)
  • C#中的通用约束,T是相同的TSomethingElse,对吧?(Generic constraints in C#, T is the same TSomethingElse, right?)
  • 从mybatis中的光标获取数据(Fetching data from cursor in mybatis)
  • 在运行时从XML构建对象的最佳方法(Best way for building objects out of XMLs at runtime)
  • 在整个窗口中拉伸sf :: Sprite(Stretch sf::Sprite across entire window)
  • Selenium Node API Web驱动程序等待超时处理程序(Selenium Node API web driver wait timeout handler)
  • 函数使用并且是map的一部分(循环依赖?)(Function uses and is part of map (circular dependency?))
  • 是否可以在C ++ 14中使用可选模板参数创建类型元组?(Is possible to make a tuple of types with optional template parameters in C++14?)
  • PHP从窗帘后面打印/ f(PHP prints /f from behind the curtains)
  • JFrame的contentPane的LayoutManager(LayoutManager of JFrame's contentPane)
  • 用于Instagram Feed的图像滚动(Image Roll Overs for Instagram Feed)
  • 如何显示拉伸字体(双倍宽度/高度)?(How to display stretched font (double width/height)?)
  • 文件操作API在fileapi.h和stdio.h中的WP8差异?(WP8 differences between file manipulation APIs in fileapi.h and stdio.h?)
  • 保存失败后Rails没有回滚事务()(Rails not rolling back transaction after failed save())
  • jqgrid中的分页问题与数组数据(Pagination problem in jqgrid with array data)
  • 重定向时,通过其他页面上的URL调用javascript函数(Call javascript function through url on otherpage while Redirecting)
  • 如何使用InvokeCommandAction调用我的方法并传入参数?(How do I go about using InvokeCommandAction to call a method of mine and pass in parameters?)
  • Jquerymobile按钮仅显示页面的第一个外观(Jquerymobile buttons are shown only first apperance of the page)