Skip to content

queenyn/open_flamingo_notes

 
 

Repository files navigation

🧠 OpenFlamingo-Learning

本项目是我个人对 OpenFlamingo 多模态大模型 的系统性学习与结构研究过程,目标是掌握现代多模态系统的核心组件,实现模块替换与实验对比,并在未来实习阶段具备撰写论文的能力。



📚 学习路线

以下五个模块构成了我当前阶段的学习路线,每个模块包含多个知识点与实际实验。

模块 说明
图像编码器 ViT、ResNet、CLIP,理解输入处理、结构与替换方案
文本编码器 Transformer/LLaMA 结构与注意力机制,处理 prompt
自监督与对比学习 SimCLR / MAE / BYOL 等训练目标与视觉预训练思想
多模态融合机制 Cross-Attention、Perceiver Resampler、Prompt 拼接
实验管理与调试 PyTorch 训练流程、wandb、模型替换控制实验设计

✅ 当前进度

📌 项目正在进行中,学习进度见 tasks_todo.md


📁 仓库结构说明

  • flamingo/:fork 的原始多模态模型代码
  • experiment_logs/:每个模块的学习笔记与实验记录
  • notebooks/:结构调试与可视化 notebook
  • results/:输出样例与可视化图表
  • README.md:学习路径与项目简介

📌 示例展示(部分)

实验 内容 状态
理解 ResNet 残差结构 掌握残差块结构及恒等映射原理 ✅ 完成

本项目 Fork 自 OpenFlamingo

About

An open-source framework for training large multimodal models.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors

Languages

  • Python 98.1%
  • Shell 1.7%
  • Makefile 0.2%