LanguageModelExperimentation

Research conducted under Prof. Kurt Keutzer at Berkeley Artificial Intelligence Research (BAIR).

Example setup

# Install conda if not already installed
wget https://repo.anaconda.com/miniconda/Miniconda3-py39_4.12.0-Linux-x86_64.sh

conda env create -f environment.yml
conda activate LME

deepspeed run.py

python scripts/read_results.py

Max batch sizes

For tib to eng translation:

GPU size	Model	Batch size
24GB	NLLB 600M	16
	NLLB 1B	4
	mT5 600M	8
	mT5 1B	4
49GB	NLLB 1B	16
	NLLB 3B	16
	mT5 1B	16
	mT5 3B	4
	mT5 13B	?

For Flores200:

GPU size	Precision	Model	Seq len	Batch size
24GB	BF16	mT5 300M	128	32
24GB	BF16	mT5 300M	256	16
24GB	FP32	mT5 300M	128	8
24GB	BF16	mT5 600M	256	8
24GB	BF16	mT5 1B	256	4
48GB	BF16	mT5 300M	128	64
48GB	BF16	mT5 300M	128	64
48GB	BF16	mT5 1B	128	32
48GB	BF16	mT5 1B	256	16
48GB	BF16	mT5 3B	256	4

Ideas

Activation function diversification
Single layer model with many attention heads

Name		Name	Last commit message	Last commit date
Latest commit History 693 Commits
cache		cache
graphs		graphs
lme		lme
results		results
scripts		scripts
statistics		statistics
.gitignore		.gitignore
README.md		README.md
environment.yml		environment.yml
run.py		run.py
setup.py		setup.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

LanguageModelExperimentation

Example setup

Max batch sizes

Ideas

About

Uh oh!

Releases

Packages

Uh oh!

Contributors 2

Uh oh!

Languages

bri25yu/LanguageModelExperimentation

Folders and files

Latest commit

History

Repository files navigation

LanguageModelExperimentation

Example setup

Max batch sizes

Ideas

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors 2

Uh oh!

Languages

Packages