- Python 3.x
- Pillow
假设图片帧已放在某个文件夹(如frames/,命名为0000.jpg, 0001.jpg等),描述文本为desc.txt:
python main.py --image_dir ./frames --text_path ./desc.txt --vlm dummy --target_fps 2参数说明:
--image_dir:图片帧文件夹路径--text_path:描述文本路径(每句话用句号分隔)--vlm:选择VLM模型(默认dummy,可扩展)--target_fps:提交给VLM的帧率(默认2)--orig_fps:原始帧率(默认4)
如需支持其他VLM,只需在vlm_wrapper.py中实现新类并在get_vlm注册。