1. LoRA 论文解读 这里先不解读了,直接看 Microsoft 的代码 2. LoRA 代码解析 lora 代码最初由微软GitHub提供...

1. pytorch 获取网络结构 在写深度学习程序时,我们通常要将网络打印出来查看网络结构,一个最简单的方法就是直接 print(model)...

1. Monkey 论文阅读 Monkey: Image Resolution and Text Label Are Important Thi...

1. MiniGPT-v2 论文解析 MiniGPT-v2: large language model as a unified interfa...

1. MiniGPT-4 论文解析 MiniGPT-4: Enhancing Vision-Language Understanding wit...

1. 更换主题 配置完 hexo 之后,我们可以自由更换主题,有很多主题的选择,官网主题,本博客使用的是hexo-theme-pure主题 安装...

12月 14, 2023

1. BLIP-2 代码解析 BLIP-2: Bootstrapping Language-Image Pre-training with Fr...

1. snapshot_download 用于从 HuggingFace下载整个 repository 的快照。可以使用这个函数下载一个 rep...

1. peft 库安装 本文参考huggingface 微调,peft 库是一个高效微调 LLM 的库,与 Transformers 和 Acc...

1. deepspeed 的基本用法 1.1 deepspeed 安装 deepspeed 的安装非常简单,只需要运行以下命令即可 pip in...