Xây dựng mô hình ngôn ngữ lớn

Nội dung

Tip: Nếu chưa cài đặt môi trường, có thể xem hướng dẫn từ README.md trong thư mục setup.

Danh sách các chương	Nội dung chính	Tất cả tài liệu + code
Ch 1: Hiểu về mô hình ngôn ngữ lớn	No code	-
Ch 2: Xử lý dữ liệu văn bản	- ch02.ipynb - dataloader.ipynb (summary) - exercise-solutions.ipynb	./ch02
Ch 3: Cơ chế Attention	- ch03.ipynb - multihead-attention.ipynb (summary) - exercise-solutions.ipynb	./ch03
Ch 4: Triển khai mô hình GPT	- ch04.ipynb - gpt.py (summary) - exercise-solutions.ipynb	./ch04
Ch 5: Tiền huấn luyện với dữ liệu không gán nhãn	- ch05.ipynb - gpt_train.py (summary) - gpt_generate.py (summary) - exercise-solutions.ipynb	./ch05
Ch 6: Tinh chỉnh cho nhiệm vụ phân loại văn bản	- ch06.ipynb - gpt_class_finetune.py - exercise-solutions.ipynb	./ch06
Ch 7: Tinh chỉnh mô hình theo phương pháp Instruction fine-tuning	- ch07.ipynb - gpt_instruction_finetuning.py (summary) - ollama_evaluate.py (summary) - exercise-solutions.ipynb	./ch07
Phụ lục A: Giới thiệu PyTorch	- code-part1.ipynb - code-part2.ipynb - DDP-script.py - exercise-solutions.ipynb	./appendix-A
Phụ lục B: Tài liệu tham khảo	No code	-
Phụ lục C: Đáp án các bài tập	No code	-
Phụ lục D: Adding Bells and Whistles to the Training Loop	- appendix-D.ipynb	./appendix-D
Phụ lục E: Tinh chỉnh hiệu quả tham số với LoRA	- appendix-E.ipynb	./appendix-E

Mô tả trực quan nội dụng của các chương và các phần

Một cái laptop, có GPU càng tốt. Cầu hình yếu quá thì có thể lên Google Colab

Cài đặt
Chương 2: Làm việc với dữ liệu văn bản
Chương 3: Cơ chế attention
- Comparing Efficient Multi-Head Attention Implementations
- Understanding PyTorch Buffers
Chương 4: Triển khai mô hình GPT model từ đầu
- FLOPS Analysis
Chương 5: Tiền huấn luyện với dữ liệu không gán nhãn:
Chương 6: Tinh chỉnh cho mục đích phân loại văn bản
Chương 7: Tỉnh chỉnh mô hình nghe theo chỉ dẫn

Name		Name	Last commit message	Last commit date
Latest commit History 875 Commits
.github		.github
appendix-A		appendix-A
appendix-D		appendix-D
appendix-E		appendix-E
ch01		ch01
ch02		ch02
ch03		ch03
ch04		ch04
ch05		ch05
ch06		ch06
ch07		ch07
pkg/llms_from_scratch		pkg/llms_from_scratch
setup		setup
.gitignore		.gitignore
CITATION.cff		CITATION.cff
LICENSE.txt		LICENSE.txt
README.md		README.md
pixi.toml		pixi.toml
pyproject.toml		pyproject.toml
requirements.txt		requirements.txt