欢迎来到尧图网

客户服务 关于我们

您的位置:首页 > 财经 > 产业 > 浅谈人工智能之基于容器云进行文生图大模型搭建

浅谈人工智能之基于容器云进行文生图大模型搭建

2024/11/30 0:21:51 来源:https://blog.csdn.net/u012151594/article/details/143866251  浏览:    关键词:浅谈人工智能之基于容器云进行文生图大模型搭建

浅谈人工智能之基于容器云进行文生图大模型搭建

引言

随着深度学习技术的不断发展,文生图(Text-to-Image)大模型成为了计算机视觉和自然语言处理领域的一个研究热点。文生图模型可以根据输入的文本描述生成高质量的图像,广泛应用于艺术创作、广告设计、虚拟现实等领域。本文将介绍如何搭建一个基于iic/cv_cartoon_stable_diffusion_design的文生图大模型。

模型效果展示

我们首先看一下我们对搭建好的模型的效果进行展示,我们的提示词如下:

a beautiful girl with sun glasses

我们得到的图片结果如下:
在这里插入图片描述

环境搭建

基于上述结果以后,我们就可以开始进行文生图环境搭建。
第一步:模型克隆

git clone https://www.modelscope.cn/iic/cv_cartoon_stable_diffusion_design.git

第二步:依赖包下载

pip install opencv-python
pip install modelscope
pip install packaging
pip install addict
pip install oss2

第三步:下载依赖包datasets,但是这里会有版本的限制,如果我们直接通过pip install datasets安装,我们会出现以下报错内容

from datasets.utils.file_utils import (OfflineModeIsEnabled,
ImportError: cannot import name ‘OfflineModeIsEnabled’ from ‘datasets.utils.file_utils’

因此我们需要指定版本:pip install datasets==2.16.0
第四步:继续安装其他依赖

pip install torch
pip install pillow
pip install simplejson
pip install sortedcontainers
pip install diffusers
pip install torchvision
pip install transformers

第五步:编写应用代码

import cv2
from modelscope.pipelines import pipeline
from modelscope.utils.constant import Taskspipe = pipeline(Tasks.text_to_image_synthesis, model='damo/cv_cartoon_stable_diffusion_design', model_revision='v1.0.0')
output = pipe({'text': 'a beautiful girl with sun glasses'})
cv2.imwrite('result.png', output['output_imgs'][0])
print('Image saved to outImage.png')

至此,整个环境搭建完成。

版权声明:

本网仅为发布的内容提供存储空间,不对发表、转载的内容提供任何形式的保证。凡本网注明“来源:XXX网络”的作品,均转载自其它媒体,著作权归作者所有,商业转载请联系作者获得授权,非商业转载请注明出处。

我们尊重并感谢每一位作者,均已注明文章来源和作者。如因作品内容、版权或其它问题,请及时与我们联系,联系邮箱:809451989@qq.com,投稿邮箱:809451989@qq.com