AdapterHub - ukp/bert-base-multilingual-cased-de-wiki

Edit on GitHub

model = AutoAdapterModel.from_pretrained("bert-base-multilingual-cased")
config = AdapterConfig.load("houlsby", non_linearity="gelu", reduction_factor=2)
model.load_adapter("de/wiki@ukp", config=config)

Description

Houlsby Adapter trained with Masked Language Modelling on German Wikipedia Articles for 250k steps and a batch size of 64.

Properties

Pre-trained model

bert-base-multilingual-cased

Adapter type

Language

Prediction Head

Task

German

Dataset

wiki

Architecture

Name

houlsby

Non-linearity

gelu

Reduction factor

{
  "ln_after": false,
  "ln_before": false,
  "mh_adapter": true,
  "output_adapter": true,
  "adapter_residual_before_ln": false,
  "non_linearity": "gelu",
  "original_ln_after": true,
  "original_ln_before": false,
  "reduction_factor": 2,
  "residual_before_ln": true
}

Author

Name

Jonas Pfeiffer

E-Mail

pfeiffer@ukp.informatik.tu-darmstadt

Web

https://pfeiffer.ai

GitHub

jopfeiff

Twitter

@PfeiffJo

Versions

Identifier	Comment	Score	Download
nd_200k DEFAULT
wd_200k

Citations

Adapter

@article{pfeiffer20madx,
  title={{MAD-X}: An {A}dapter-based {F}ramework for {M}ulti-task {C}ross-lingual {T}ransfer},
  author={Pfeiffer, Jonas and Vuli\'{c}, Ivan and Gurevych, Iryna and Ruder, Sebastian},
  journal={arXiv preprint},
  year={2020},
  url={https://arxiv.org/pdf/2005.00052.pdf},
}

Architecture

@misc{houlsby2019parameterefficient,
  title={Parameter-Efficient Transfer Learning for NLP},
  author={Neil Houlsby and Andrei Giurgiu and Stanislaw Jastrzebski and Bruna Morrone and Quentin de Laroussilhe and Andrea Gesmundo and Mona Attariyan and Sylvain Gelly},
  year={2019},
  eprint={1902.00751},
  archivePrefix={arXiv},
  primaryClass={cs.LG}
}

Adapter for de/wiki

ukp / bert-base-multilingual-cased-de-wiki_houlsby

Description

Properties

Architecture

Configuration

Author

Versions

Citations

BibTeX

Adapter

Architecture