LLM Story Generation

Fine-tuning GPT-2, DistilGPT-2, and AWD-LSTM models on the Facebook AI ROCStories dataset (300k story-prompt pairs) for coherent narrative generation.

Models Explored

Model	Approach	Notebook
GPT-2	Causal LM fine-tuning via HuggingFace Transformers	`FIne_tuning_GPT2.ipynb`
DistilGPT-2	Lighter GPT-2 variant, faster training	`Fine_tuning_DistilGPT.ipynb`
AWD-LSTM	Recurrent baseline (ASGD weight-dropped LSTM)	`AWD_LSTM.ipynb`

Dataset

The ROCStories Corpus from Facebook AI Research:

300,000 five-sentence stories
Each story has an associated cloze-test prompt
Covers everyday narrative scenarios

Data loading and preprocessing: dataLoading.py · Data Preprocessing.ipynb · Story Generation Data Loading.ipynb

Quick Start

git clone https://github.com/harivilasp/LLM-Story-Generation.git
cd LLM-Story-Generation
pip install torch transformers datasets jupyter

Run notebooks in this order:

Data Preprocessing.ipynb — clean and tokenize the dataset
FIne_tuning_GPT2.ipynb or Fine_tuning_DistilGPT.ipynb — train the model
Evaluate output in the same notebook; compare with AWD-LSTM baseline in AWD_LSTM.ipynb

Evaluation

Human evaluations are logged in Human_Evaluations.xlsx, covering:

Coherence
Fluency
Relevance to prompt

Transformer-based models (GPT-2, DistilGPT-2) consistently outperformed the AWD-LSTM baseline on all three dimensions.

Requirements

Python 3.7+
PyTorch
HuggingFace transformers and datasets
Jupyter

Acknowledgements

Facebook AI Research — ROCStories dataset
HuggingFace for pre-trained model weights and Trainer API

Name		Name	Last commit message	Last commit date
Latest commit History 2 Commits
.idea		.idea
AWD_LSTM.ipynb		AWD_LSTM.ipynb
Data Preprocessing.ipynb		Data Preprocessing.ipynb
FIne_tuning_GPT2 .ipynb		FIne_tuning_GPT2 .ipynb
Fine_tuning_DistilGPT.ipynb		Fine_tuning_DistilGPT.ipynb
Human_Evaluations.xlsx		Human_Evaluations.xlsx
README.md		README.md
Story Generation Data Loading.ipynb		Story Generation Data Loading.ipynb
Transformers.py		Transformers.py
dataLoading.py		dataLoading.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

LLM Story Generation

Models Explored

Dataset

Quick Start

Evaluation

Requirements

Acknowledgements

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

LLM Story Generation

Models Explored

Dataset

Quick Start

Evaluation

Requirements

Acknowledgements

About

Topics

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages