分析印度杂志
现在读
在线机器学习(OML)与传统机器学习有何不同?
分析印度杂志

在线机器学习(OML)与传统机器学习有何不同?

  • 当数据连续流动时,为了进行实时分析,在线学习是必不可少的。

在线机器学习(OML)是一种机器学习(ML)顺序数据获得和利用更新的最佳预测未来数据每一步,与一批学习技术,生成最佳预测值通过学习完整的训练数据集。与“传统”机器学习解决方案相比,在线机器学习采用了一种根本不同的方法,它认识到学习环境可能(而且经常)每秒都在变化。当算法必须动态适应数据中的新模式时,或者当数据是作为时间函数生成时,就会使用它。

当在整个数据集上进行训练在计算上是不切实际的,需要使用核外算法时,OML是机器学习领域中广泛使用的技术。OML,它是一种机器学习技术,每次接收一个实时数据样本。OML适用于挑战随着时间的推移提供样本,它们的概率分布也预计会随着时间的推移而变化。因此,预计模型将以类似的速度发展,以捕获和响应这些变化。在实时个性化至关重要的特定行业,这可能被视为一种好处。

注册AWS数据分析会议>>

培训和复杂性

在离线ML模型中,特别是在训练过程中,机器学习模型的权值和参数被更新,同时尝试使用用于训练模型的数据最小化全局代价函数。模型不断地接受训练和更新,直到它足够健壮,可以部署和更新大数据处理,以及任何其他用例。

然而,在OML流程中,在给定步骤中发生的权重变化取决于所显示的(当前)示例,可能还取决于模型的当前状态。因此,模型总是接触到新的数据并不断改进(学习)。

时间

一般来说,离线ML模型训练比在线模型训练快得多,因为整个模型只使用数据集修改权重和参数一次。然而,由于现代的规模大数据流,将所有数据提供给脱机模型可能相当耗时。以增量的方式更新模型可能更可取。

因此,在OML中,模型必须在新数据可用时实时获取和调优其参数。这可能偶尔会导致更高的成本,并需要使用更多的资源(集群)来持续地训练模型。

另请参阅

特性 毫升 OML
复杂性 因为模型是恒定的,所以复杂性降低了。 动态复杂性是由于模型的不断演化。
计算能力 更少的计算,一次基于批处理的训练。 模型优化计算是由连续的数据摄入驱动的。
应用程序 图像分类,或任何涉及机器学习的东西,数据模式是一致的,没有快速的概念转变。 用于经常出现新数据模式的金融、医疗和经济等领域。
工具 Sci-kitMLlib火花,TensorFlowKeras, Pytorch。 积极研究:MOA,萨摩亚,Scikit-multiflow,streamDM

OML库

是一个用于OML的Python库。它是通过结合而产生的奶油scikit-multiflow.River的目标是成为对流数据进行机器学习的标准库。对于各种在线学习活动,它提供先进的学习算法、数据处理方法和性能指标。

OML还有几个库可用。

  • Python scikit-learn或Orange模块。在在线学习的情况下,Scikit-learn包括SGD可以对数据进行部分拟合的分类器和回归器。
  • R中的插入包。
  • 它支持c++, Python, Ruby和Java客户端。
  • Python中的龙卷风框架
  • LIBOL在c++(和Matlab)。
  • LibTopoART库在c#。
你怎么看?

加入我们的不和服务器。加入一个有吸引力的在线社区。加入这里


订阅我们的通讯

通过分享你的电子邮件获得最新的更新和相关的优惠。

188BET网页

滚动到顶部
Baidu