Visual ChatGPT连接 ChatGPT 和一系列 Visual Foundation Models 以实现在聊天过程中发送和接收图像。

231次阅读
没有评论

Visual ChatGPT连接 ChatGPT 和一系列 Visual Foundation Models 以实现在聊天过程中发送接收图像。

请参阅我们的论文:Visual ChatGPT:使用 Visual Foundation 模型交谈、绘图和编辑Visual ChatGPT连接 ChatGPT 和一系列 Visual Foundation Models 以实现在聊天过程中发送和接收图像。

快速开始

# create a new environment
conda create -n visgpt python=3.8

# activate the new environment
conda activate visgpt

#  prepare the basic environments
pip install -r requirement.txt

# download the visual foundation models
bash download.sh

# prepare your private openAI private key
export OPENAI_API_KEY={Your_Private_Openai_Key}

# create a folder to save images
mkdir ./image

# Start Visual ChatGPT !
python visual_chatgpt.py

显存占用

这里我们列出了每个视觉基础模型的GPU内存使用情况,可以修改self.tools较少的视觉基础模型以节省您的GPU内存:

基础模型 内存使用 (MB)
图片编辑 6667
图片说明 1755
T2I 6677
canny2image 5540
line2image 6679
hed2image 6679
scribble2image 6679
姿态图像 6681
BLIPVQA 2709
seg2image 5540
深度2图像 6677
正常2图像 3974
指导像素2像素 2795

正文完
 
Windows12系统管理员
版权声明:本站原创文章,由 Windows12系统管理员 2023-03-12发表,共计702字。
转载说明:除特殊说明外本站文章皆由CC-4.0协议发布,转载请注明出处。
评论(没有评论)