首页 > 资讯 > > 正文

环球快报:赚足眼球的AI作画,如何实现AIGC的价值,商汤给出了答案

2023-04-25 17:31:32 来源:机器之心Pro

机器之心原创

作者:小舟


(资料图片仅供参考)

AIGC,不只是一场狂欢。

最近,社交平台上一些 AI 作画工具引起广泛关注,比如因「情侣合影」刷屏的 Midjourney v5 和刚刚开启公测的 Stable Diffusion XL。

Midjourney v5 和 Stable Diffusion XL 生成的图像。

AI 生成的图像天马行空,在互联网上掀起了一场狂欢,AIGC(人工智能生成内容)也成为一个爆款词汇,人们惊呼 AI 技术的迅速发展。

狂欢之后,我们需要想想:AIGC 的现实价值是什么?

AIGC 被认为是继专业生产内容(PGC)、用户生产内容(UGC)之后的新型内容创作方式,人们期待 AI 能够掀起新一轮内容生产变革。当前,大部分 AI 作画工具是面向个人消费者(to C)的应用产品,这些产品的生成效果的确让人眼前一亮。

但想让 AIGC 赋能各行各业,提升生产力,做出面向 B 端客户的高效、专业的应用才是关键。

最近,长期深耕 to B 业务的商汤科技宣布推出秒画 SenseMirage,为 AI 作画打开了商业应用的新格局。

秒画是基于商汤自研的文生图大模型,依托商汤 AI 大装置 SenseCore 强大算力集群的 AI 作画平台。在秒画平台上,B 端客户可以使用商汤自研的文生图大模型快速生成图像。

其效果如何?背后技术是什么?有哪些特色与优势?让我们一一为你揭秘。

多种风格、秒速生成

不同于 Stable Diffusion、Midjourney,秒画是一个 to B 的 AI 作画平台,将广泛应用于设计、营销、游戏动画、工程建筑、医学、教育科普等领域。我们来看一些秒画平台中商汤自研文生图大模型的生成样例。

首先,面向时尚设计领域,商汤自研大模型生成的「中国女士时尚街拍图如下」:

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像——中国女士时尚街拍图。

还能生成巴黎时装周摄影风的模特图像:

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像——巴黎时装周模特图片。

我们也和其他文生图模型进行了效果对比,例如生成图像:一只戴着珍珠耳环的鹦鹉,商汤自研模型的生成效果如下:

Prompt:(混合语言输入)一只戴着珍珠耳环的鹦鹉,维米尔风格,12K,高画质,高清,octane render

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像——戴珍珠耳环的鹦鹉。

同样的 prompt 翻译成英文后,我们尝试用 Stable Diffusion XL 生成,但并没有得到符合要求的结果。部分图像没有以鹦鹉作为主体,部分即便生成了鹦鹉,但缺少珍珠耳环等细节。

Stable Diffusion XL 生成的一组图像。

在游戏动画领域,商汤自研的文生图模型也有很强大的生成能力,生成的图像符合文本描述,且细节丰富,有动画感染力。例如生成一只「愤怒的皮卡丘」:

Prompt:(中文输入)愤怒的皮卡丘,它的眼睛是红色的,周围电闪雷鸣,超写实主义风格

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像——愤怒的皮卡丘。

同样的 prompt 翻译为英文输入后,Stable Diffusion XL 生成的结果不尽如人意,要么是皮卡丘不够愤怒,要么是图像细节不到位。

Prompt: A pikachu with an angry expression and red eyes, with lightning around it, hyper realistic style

Stable Diffusion XL 生成的一组图像。

我们发现,秒画平台中商汤自研的文生图模型可以生成符合要求的高质量图像,而且非常适用于设计和游戏动画行业。下面我们就看一下这个文生图大模型的具体细节。

超 10 亿参数的自研文生图大模型

要想让大模型足够好、AI 作画足够逼真,就要具备三个核心元素,包括模型架构、优化方法和底层基建。

首先,模型本身的结构设计要足够高效。一般来讲,神经网络变得更大,模型学习能力就会更强。但如何保证在同等超大参数量下,模型能够具有性能优势,这就需要在模型的神经网络结构设计上多下功夫。

从 2019 年开始,商汤就研发了一套半自主的超大模型结构设计 pipeline。它能够帮助研究员在模型参数量特别大的情况下,设计出高效的神经网络算子,同时商汤还使用 AutoML 平台把这些算子结合起来。

因此,商汤自研的大模型是基于研究人员和 AI 一起设计出来的超大神经网络结构。在这个结构下,相同的数据、相同的参数量,商汤自研的模型在性能上就有显著的优势。经过训练的模型,在生成效果上会比单纯把深度、宽度加大一些量级的模型好很多。

第二,在这套模型架构设计 pipeline 里,研究人员会手工设计一些优化方法。

传统的神经网络训练都是用 SGD、Adam 优化器等等。而在过去的几年里,商汤在超大神经网络的梯度下降优化方法上做了非常多的研究。

特别大的模型在优化上有一个非常严重的问题,是模型训练过程的收敛性很难保证。这可能因为优化器不够好,也可能是因为数据里有噪声,导致模型在极个别错误的样本下产生极大的损失函数值。此外,对于基于扩散模型的生成式模型来说,生成的语义完备性、物体宏观结构、细节(比如手指、四肢等)、推理步的加速等都有较大改进空间。商汤的研究团队基于这些问题做了大量的优化,以确保商汤自研的文生图、视觉感知等大模型都能够在一个很长周期内保持训练稳定、高效。

具体来说,为了让该模型生成的图像质量更高、细节更丰富、风格更多样,商汤的研究团队自研了分层推理专家(hierarchical inference experts)、图像质量感知的分布式训练(image quality-aware distributed training)、图像纹理指导的交叉注意力学习(texture-guided cross-attention learning)等优化算法。

第三,算法与底层基建要绑定配合,联合优化。当模型的体量足够大,就需要用 3D 切割的方法从神经网络深度,宽度以及数据 batch 的三个维度来切割神经网络,再分配到上千块 GPU 上,在每个 GPU 上进行局部计算,就会涉及到非常多机器学习系统的问题。比如在计算每一个分块计算的全局结果时,需要把不同卡的计算结果结合起来。而这又会导致一个问题 —— 每个 GPU 上的子模型在相互通信时,带宽要求会非常大。

然而,机器学习系统中通常是一个 POD 内的 P2P 通信带宽很大,POD 之间的通信带宽很小,因此商汤的研究团队专门针对这个问题对神经网络的结构进行了特异性设计,让只能在一个 POD 内通信的子模型尽量放在一个 POD 里,而通信带宽要求相对较小的一些模块(比如不同的 experts)就放到不同的 POD 之间,这就可以让大模型与商汤的 AI 大装置进行联合优化,以获得更高的训练效率。

这三个技术要素让商汤自研的文生图大模型具备了更优的文本理解能力和逼真的生成效果。在 prompt 比较详细复杂的时候,该模型可以生成带有故事性的逼真图像。例如提供 prompt 让模型生成皮卡丘和马里奥打斗的场景:

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像——皮卡丘和马里奥打斗。

在秒画平台上,商汤自研的文生图大模型是一个基础模型,B 端客户仅用少量数据就可以迅速微调得到一个适用于下游任务的垂类模型,大大降低了训练门槛。

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像。

独具优势的文生图平台

除了商汤自研的文生图大模型,秒画还是一个可以导入其他开源模型的平台,被称为「模型超市」。

可从第三方平台导入模型,并启动秒画 SenseMirage 平台的模型编译技术进行推理加速的效果展示。

在秒画平台上,用户可以一键导入 Hugging Face、Civitai、GitHub 等第三方社区的开源模型,并且添加至用户「我的模型库」列表中,方便进行体验,让用户免除本地化部署的繁琐流程。

这是为了大幅降低 AI 作画的商用门槛。对于一些中小型企业来说,本地化部署大模型的成本是非常高的。硬件方面,训练垂类模型需要搭建一定规模的 GPU 算力集群,还需要专业的技术团队,人力成本也是比较高的。

秒画为商汤自研文生图模型和开源模型提供了一套算法框架和强大的算力基础设施 ——AI 大装置 SenseCore。B 端用户可以直接在秒画平台上训练定制化的 LoRA 模型,基于现有商汤自研文生图模型的高度泛化性,B 端用户只需要拖拽 20 张左右图片作为训练集,最低仅需 5 分钟就能完成一个高质量模型的训练。这让中小型企业也能轻松拥有属于自己的垂类模型。

此外,秒画还提供了特异性推理优化服务,开源模型导入后会自动采用秒画平台底层的模型编译技术进行加速。借助这项加速技术,在本地 RTX 3070 显卡上需要 10 秒生成的图像,秒画只要 2 秒的推理时间就可以生成。

总体来说,秒画是一个依托商汤 AI 大装置 SenseCore 的 to B 文生图平台,它基于商汤自研的超 10 亿参数文生图大模型,也能一键导入第三方开源模型,为 B 端客户免去了本地化部署的繁琐流程,并提供了简单快速的训练服务和推理加速功能。

打开 AIGC 的商业价值

随着生成式 AI 模型迎来爆发式增长,越来越多的人开始探索 AIGC 的潜在应用场景。不同于 to C 的应用软件,to B 的 AIGC 平台需要为各行业找到合适的商业模式。

作为深耕 to B 业务的公司,商汤自去年开始就为 B 端用户提供定制化的文生图模型,当时的常见做法是根据用户的需求为客户训练并封装成 SDK 来交付。这样的业务积累也让商汤有了构建通用文生图平台的新思路,秒画应运而生。

在文生图领域,设计、营销、游戏动画等行业未来将成为 AI 作画的主要应用场景。作为 to B 的文生图平台,秒画具备赋能这些行业的优势。

例如,对比同类产品的生成效果,秒画更适用于商业设计和产品营销。在下面这个生成汽车图像的例子中,相比于 Stable Diffusion,商汤自研模型的生成结果更符合 prompt 中的「概念设计」和「水墨」这两个关键词。

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像与Stable Diffusion模型生成图像

类似地,在游戏动画行业,图像的展现效果将直接影响产品的质量,这对赋能该行业的 AIGC 工具提出了更高的要求,包括图像生成效果和对文本的理解能力两方面。以下图生成「梦幻的蝴蝶」为例,基于商汤自研模型的优化技术,秒画在图像风格、细节刻画等方面都更符合行业要求。

“商汤秒画 SenseMirage”基于商汤自研 AIGC 模型生成的图像与Stable Diffusion模型生成图

一方面,秒画为 B 端客户大幅降低了文生图垂类模型的构建门槛和商用成本;另一方面,秒画也符合当前主流 AI 作画的应用场景,提高了文生图模型的实用价值。

在 AI 作画赚足眼球的今天,秒画平台从赋能行业的角度出发,为 AIGC 打开商业价值提供了一个新的思路。

最后,我们想说,文生图只是 AIGC 的方向之一。随着生成式 AI 模型的迅速发展,AI 生成文本、AI 生成视频等等多个领域都在加快应用落地,AI 终将掀起内容生产的新一轮变革。

责任编辑:

标签:

环球快报:赚足眼球的AI作画,如何实现AIGC的价值,商汤给出了答案

总体来说,秒画是一个依托商汤AI大装置SenseCore的toB文生图平台,它基于商汤自研的超10 亿参数文生图大模

2023-04-25 17:31:32

雷军回应网友想要小尺寸手机:销量支撑不了旗舰的研发成本

鞭牛士4月25日消息,近日,有网友给小米创办人雷军留言,他想要更小尺寸的手机。对此,雷军表示:“更小...

2023-04-25 17:04:39

跨境车险互联互通加速: “三地保单一地购买”累计承保港澳跨境机动车7.16万辆次_天天快消息

4月25日,广东保险业2023年一季度新闻通气会在广州举行。

2023-04-25 16:58:10

每日速讯:月度保费观察(一季度)|寿险保费持续回温 平安、国寿人身险业务同比增速均超3.5%

月度保费观察(一季度)|寿险保费持续回温平安、国寿人身险业务同比增速均超3 5%,产险,车险,唱片,人保财险

2023-04-25 16:23:46

蒜怎样种好_大蒜怎么种 世界播资讯

解答:1、准备好大蒜,打碎成块,不用削皮,带皮就可以种。2、准备一个花盆,在花盆中放入肥沃、疏松、排水

2023-04-25 15:43:01

典型的屋顶桁架布局

预制桁架改进了屋顶框架。它们是在可以精确切割和设置角度的工厂制造的,并且接头是用比传统框架钉更坚固的

2023-04-25 15:15:37

三亚市气象台发布雷电黄色预警【Ⅲ级/较重】【2023-04-25】 当前焦点

三亚市气象台发布雷电黄色预警【Ⅲ级 较重】【2023-04-25】

2023-04-25 15:15:28

邮箱imap怎么设置_imap是什么意思|报资讯

1、IMAP4概述IMAP4协议与POP3协议一样也是规定个人计算机如何访问互联网上的邮件服务器进行收发邮件的协议,但

2023-04-25 15:09:53

快看:普陀区启动第五次全国经济普查综合试点工作

❖第五次全国经济普查是一次重大国情国力调查,是党的二十大胜利召开之后开展的首次大型普查。普陀区是上海

2023-04-25 14:22:08

茶百道成立咖弗瑞实业公司# 此前曾申请咖啡商标

天眼查App显示,近日,海南咖弗瑞实业有限公司成立,注册资本1000万人民币,法定代表人为王霄锟,经营范围

2023-04-25 14:07:43

今热点:拉面用什么面粉好 做拉面用哪种面粉最好

1、中筋面粉。2、中筋面粉是介于高、低筋面粉之间的面粉,颜色是乳白色,质感比较松散,制作时将中筋面粉混

2023-04-25 13:35:28

每日简讯:吉林省消协提示:“五一”消费优惠多 文明畅游嗨起来

吉林省消协提示:“五一”消费优惠多文明畅游嗨起来

2023-04-25 13:22:02

2024奥斯卡颁奖典礼将于明年3月10日举行 全球播资讯

2024奥斯卡颁奖典礼将于明年3月10日举行,奥斯卡,最佳女主角,瞬息全宇宙,杨紫琼

2023-04-25 12:49:08

世界热点评!国王官宣福克斯左手食指撕脱性骨折,不大可能出战G5

国王官宣福克斯左手食指撕脱性骨折,不大可能出战G5,食指,骨折,卢尼,勇士,woj,美国篮球,德阿隆·福克斯

2023-04-25 12:45:26

大咖访谈:铝企如何实现双碳目标、解决能源供给稳定性? 风光电发展潜力大!【SMM铝峰会】

SMM4月23日讯:在SMM主办的2023SMM(第十八届)国际铝业峰会-主论坛上,由SMM伦敦办

2023-04-25 12:21:30

2023年4月25日连玉米期货早盘行情

据生意社统计,2023年4月25日,星期二,大连商品交易所玉米期货主力2307合约,截止到9:00,开盘2665元,最

2023-04-25 12:17:52

中山公用董秘回复:截至2023年4月20日,公司股东总户数40,849户_世界焦点

中山公用(000685)04月25日在投资者关系平台上答复了投资者关心的问题。

2023-04-25 12:06:04

【播资讯】水利部:扩大水利投资规模 做好重大水利工程信贷支撑保障

4月25日电,水利部、中国建设银行4月23日召开金融支持水利基础设施建设工作推进会。水利部副部长田学斌强调

2023-04-25 12:02:41

北京故宫博物院票价政策! 全球观点

来源:故宫博物院官网1 门票价格:(1)每年4月1日至10月31日为旺季,大门票60元 人;(2)每年11月1日至次

2023-04-25 12:02:28

盛视早参:节前避险情绪升温 建议以轻仓博弈为主

盛视早参:节前避险情绪升温建议以轻仓博弈为主

2023-04-25 11:52:44

2023年湖南高考报名人数68万人 省教育厅:重点实施好高校专项计划

创新高!今年湖南高考报名人数达68万继续实施国家专项计划、高校专项计划和地方专项计划长沙晚报4月24日讯

2023-04-25 11:50:58

中国妇基会与联想控股持续帮扶榆树市草编创业女性 共同助力乡村产业振兴_要闻

乡村振兴是党的十九大提出的重大战略,是新时代做好 "三农 "工作的总抓手。2023年中央一号文件在部署...

2023-04-25 11:41:01

世界资讯:一罐红牛养出3位富豪,却7年纠葛未了

华彬集团与泰国天丝的红牛商标之争依然未能结束。在近日,泰国天丝表示收到了一份最新的判决书,中国红牛相

2023-04-25 11:40:24

环球速读:“动”起来!五一消费市场复苏势头强劲

临近小长假,北京市朝阳区一家餐馆推出“迎五一”促销活动。人民网记者乔业琼摄“来,试试我一把能抓几...

2023-04-25 11:26:59

天天报道:桂林市市场监管局召开“壮族三月三”、五一节前食品安全工作布置会

为做好全市食品安全风险防范,保障人民群众食品安全,桂林市市场监管局召开“壮族三月三”、五一节前食...

2023-04-25 11:25:27

天天报道:消息称宝马正为安卓用户带来数字汽车钥匙支持 目前支持Pixel和三星

世界消息!《灌篮高手》为何能引发追捧?

今日播报!2023年护考成绩考后45个工作日内公布

亨迪药业:截至2023年4月20日,公司股东户数为24,371户

饮料制造板块拉升,青岛啤酒涨超4%_每日速看

做精密科学仪器供应商 皖仪科技在IEexpo2023奋进新征程|世界新消息

中秋节兰州出发自驾游旅游(元旦兰州周边自驾游)-当前快报

[年报]德必集团2022年营收7.79亿元 园区管理面积超118万平方米 世界报道

全球即时看!中国足彩网竞彩25日推荐:赫罗纳主场状态不俗

消费者预订“五一”期间民宿遭遇“威胁式”砍单

康冠科技:目前经营一切正常 在手订单充足

越南巴沙鱼需求持稳,鱼苗价格下跌,养殖户等待价格进一步反弹|天天快消息

怎么关联qq号聊天不被对方看见_怎么关联qq号

世界快消息!天马股份、大东南等45股获陆股通增仓超100%

能品妙品神品逸品什么意思_神品 逸品 妙品 能品 下品指什么 世界新消息

斯诺克世锦赛斯佳辉13-7大胜米尔金斯晋级8强

第十三届北京国际电影节:快闪“电影音乐走进山水怀柔” 全球速看

好看的英语单词网名女生_好看的英语单词网名

苏炳添提起诉讼|今日法治硬核 全球热点

中金:东部算力资源缺口或将加大 西部地区网络运力升级在望

4月21日起,张家港晨丰公路北半幅开展老路病害处理 天天新视野

朱一龙河边的错误入围戛纳,究竟是怎么一回事?

当前关注:肺结核和感冒如何区分?该怎样预防?这些知识要知道

今日要闻!搞笑相声剧本2人爆笑_相声剧本2人爆笑

天天看点:这里,近95万升污水泄漏!公共海滩关闭!媒体:污水含各种病原体,或引起疾病

x 广告
x 广告

Copyright @  2015-2022 每日家电网版权所有  备案号: 浙ICP备2022016517号-15   联系邮箱:5 146 761 13 @qq.com