Google 提出的预训练语言表示模型,通过双向 Transformer 在大量无标注文本上进行预训练。
BERT-Base 是 Google 提出的预训练语言表示模型,通过双向 Transformer 在大量无标注文本上进行预训练,是 NLP 领域的里程碑。
BERT 在 11 项 NLP 基准测试中刷新了记录,包括问答(SQuAD)、文本分类(GLUE)等任务,开启了 NLP 领域的预训练时代。
from transformers import BertTokenizer, BertModel
tokenizer = BertTokenizer.from_pretrained("bert-base-uncased")
model = BertModel.from_pretrained("bert-base-uncased")