Coggle专业的数据科学、大模型和数据竞赛社区
首页竞赛博客教程模型应用
首页竞赛博客教程模型应用常见链接在线工具

内容

  • 竞赛
  • 博客
  • 教程
  • 模型

资源

  • 常见链接
  • 工具
  • 应用

关于

  • 关于 Coggle
  • 隐私政策

© 2026 Coggle Community. All rights reserved.

  1. 首页
  2. 博客
  3. 数据为中心的机器学习
BERT特征工程

数据为中心的机器学习

Coggle 阿水·2021年12月6日

Part2 相关比赛

Data-Centric AI Competition

  • 比赛主页:https://https-deeplearning-ai.github.io/data-centric-comp/
  • 比赛提交:https://worksheets.codalab.org/worksheets/0x7a8721f11e61436e93ac8f76da83f0e6
  • 优胜选手分享
    • https://www.deeplearning.ai/data-centric-ai-competition-synaptic-ann/
    • https://www.deeplearning.ai/data-centric-ai-competition-innotescus/
    • https://www.deeplearning.ai/data-centric-ai-competition-kaist-aiprlab/
    • https://www.deeplearning.ai/data-centric-ai-competition-johnson-kuan/
    • https://www.deeplearning.ai/data-centric-ai-competition-divakar-roy/
    • https://www.deeplearning.ai/data-centric-ai-competition-mohammad-motamedi/
    • https://www.deeplearning.ai/data-centric-ai-competition-pierre-louis-bescond/
    • https://www.deeplearning.ai/data-centric-ai-competition-godatadriven/

DataClue

DataCLUE是一个以数据为中心的AI测评。它基于CLUE benchmark,结合Data-centric的AI的典型特征,进一步将Data-centric的AI应用于 NLP领域,融入文本领域的特定并创造性丰富和发展了Data-centric的AI。

  • 比赛主页:https://www.CLUEbenchmarks.com/dataclue.html
  • Github地址:https://github.com/CLUEbenchmark/DataCLUE
  • 评测论文:https://arxiv.org/pdf/2111.08647.pdf

AAAI-2022 安全AI挑战者计划第八期:以数据为中心的鲁棒机器学习

在图像分类的对抗鲁棒性研究中,为了加快以数据为中心的相关的技术研究,我们组织了本次比赛,目的是开发新的以数据为中心的算法,例如数据增强、标签细化、制造对抗性数据,甚至设计来自其他领域的知识融合算法。鼓励参与者自由开发新颖的想法,找到有效的以数据为中心的技术,以促进训练更加鲁棒的机器学习模型。

  • 比赛主页:https://tianchi.aliyun.com/competition/entrance/531939/introduction

Part3 视频讲座

  • Youtube-DeepLearingAI A Chat with Andrew on MLOps: From Model-centric to Data-centric AI
  • Youtube-DeepLearingAI Data-centric AI: Real World Approaches
  • Youtube-Intel Business History of Data-Centric Architecture
  • bilibili-二次元的Datawhale Data Centric vs Model Centric
  • bilibili-二次元的Datawhale 企业对于数据人才的能力需求

Part4 相关论文

  • A Data-Centric Framework for Composable NLP Workflows
  • Pervasive Label Errors in Test Sets Destabilize Machine Learning Benchmarks

Part5 领域数据集

目录

  • Part2 相关比赛
  • Data-Centric AI Competition
  • DataClue
  • AAAI-2022 安全AI挑战者计划第八期:以数据为中心的鲁棒机器学习
  • Part3 视频讲座
  • Part4 相关论文
  • Part5 领域数据集

相关文章

BERT特征工程

BERT Pooling方法

详解 AutoML原理和组成

Coggle 阿水·2022年2月6日
BERT特征工程

机器学习指标

详解 AutoML原理和组成

Coggle 阿水·2021年12月6日
特征工程数据预处理

归一化方法汇总

数据归一化的原理与常见方法,涵盖 Min-Max、Z-Score 等归一化技术及其在模型训练中的作用。

Coggle 阿水·2022年5月1日