Coggle专业的数据科学、大模型和数据竞赛社区
首页竞赛博客教程模型应用
首页竞赛博客教程模型应用常见链接在线工具

内容

  • 竞赛
  • 博客
  • 教程
  • 模型

资源

  • 常见链接
  • 工具
  • 应用

关于

  • 关于 Coggle
  • 隐私政策

© 2026 Coggle Community. All rights reserved.

  1. 首页
  2. 博客
  3. 自动机器学习
Kaggle机器学习

自动机器学习

Coggle 阿水·2022年5月6日

常见Python库

  • Auto-Sklearn
    • 主页:https://www.ml4aad.org/automl/auto-sklearn/
    • Github:https://github.com/automl/auto-sklearn

在机器学习中超参数控制模型如何表现,也影响了模型的精度,超参数需要提前设置。在sklearn中也内置了Grid Search和Random Search的超参数搜索方法。

本文总结了Python环境下常见的超参数优化库,欢迎收藏和阅读。

Ray-Tune

https://github.com/ray-project/tune-sklearn

SigOpt

https://sigopt.com/

SmartML

https://bigdata.cs.ut.ee/smartml/index.html

Optuna

https://github.com/optuna/optuna

Hyperopt

https://github.com/hyperopt/hyperopt-sklearn

https://github.com/hyperopt/hyperopt

Metric Optimisation Engine (MOE)

https://github.com/Yelp/MOE

mlmachine

https://github.com/petersontylerd/mlmachine#Installation

Polyaxon

https://polyaxon.com/docs/automation/optimization-engine/

Bayesian Optimization

https://github.com/fmfn/BayesianOptimization

SHERPA

https://parameter-sherpa.readthedocs.io/en/latest/

Scikit-Optimize

https://scikit-optimize.github.io/stable/user_guide.html

GPyOpt

https://sheffieldml.github.io/GPyOpt/

在今年KDD会议现场,由阿里同学分享了AutoML: A Perspective where Industry Meets Academy,分享中对AutoML做了工业案例的介绍,非常适合入门学习。

AutoML主要的落地方向如下:

  • Auto Feature Generation
  • Neural Architecture Search
  • Hyperparameters Optimization
  • Meta Learning

Hyperparameter Optimization (HPO)

HPO关注如何在给定模型的情况下,找到最优的超参数,这个过程非常使用使用AutoML。

  • Hyperparameter configuration找到固定的超参数设置以最大化模型性能。
    • Random search, Grid Search
    • Successive-halving, Hyperband
    • Bayesian optimization
  • Hyperparameter schedule在模型训练过程中寻求动态超参数调度。
    • Population-based training
    • Hypergradient

Hyperparameter schedule关注如何在全局搜索和局部搜索之间取得良好的权衡。

Neural Architecture Search (NAS)

NAS关注找到神经网络的最佳拓扑和网络配置,应用的也非常大。现在很多CNN模型都是通过NAS搜索得到。

  • 搜索空间
    • 与网络相关的配置,如 filter size, activation functions, depth
  • 搜索策略
    • How to utilize experience?
    • How to propose new configuration
    • 如RL, ES, and differentiable search.
  • 精度验证
    • How to evaluate a configura+on?

Meta-Learning

Meta-Learning在元数据集包含多个数据集,其中每个数据集都是不同的任务。

Auto Feature Generation

自动特征工程关注如何产生有效的特征,且希望产生的特征能带来更好的模型精度。

  • DNN-based methods:设置可学习、可交叉的网络结构
  • Search-based methods:特征交叉的空间搜索和剪枝。

ML-Guided Database

使用机器学习来优化数据库的索引、查询和数据库配置。

100%

目录

  • 常见Python库
  • Ray-Tune
  • SigOpt
  • SmartML
  • Optuna
  • Hyperopt
  • Metric Optimisation Engine (MOE)
  • mlmachine
  • Polyaxon
  • Bayesian Optimization
  • SHERPA
  • Scikit-Optimize
  • GPyOpt
  • Hyperparameter Optimization (HPO)
  • Neural Architecture Search (NAS)
  • Meta-Learning
  • Auto Feature Generation
  • ML-Guided Database

相关文章

sklearn机器学习调参

Sklearn 超参数搜索方法

详解 Sklearn 中四种超参数搜索方法:GridSearch、RandomizedSearch 等,附完整代码示例。

Coggle 阿水·2022年9月1日
sklearn机器学习

Sklearn 批量训练方法

解决数据量太大导致内存不足的问题,介绍增量训练、分块加载等批量训练方法。

Coggle 阿水·2022年8月1日
机器学习基础

机器学习术语表

机器学习常用术语与概念速查表,涵盖评估指标、模型类型等核心概念。

Coggle 阿水·2022年3月1日