我从未见到过哪些工具会取代人,我倒是经常见到正因为是通过人的使用才让这些工具充满价值。
先邀请大家我们一起进行一个小游戏互动,下面一组图片我们筛选一下看哪些是真人照片哪些是 AI 生成的,答案我就放在结尾为大家揭秘。
大家选择完毕后,接下来我将为大家带来关于介绍是如何通过 Midjourney 来生成真人照片的,以及怎样在实践项目中运用这些真人照片。
1. 照片的由来
要问为什么要使用 Midjourney 来生成真人照片,那么我们先从照片的历史来切入,照片的历史由来可以分为五个阶段(相机的发明(19 世纪)——达盖尔剧照法(1839年)——胶片摄影(19世纪末至20世纪)——黑白摄影和彩色摄影(20世纪)——数码摄影(20世纪末至今——社交媒体和照片共享(21世纪))
相机的发明(19 世纪):照片的历史开始于相机的发明。最早的相机大约可以达到约 5 世纪的希腊,但直到 19 胚胎,才有真正可靠的摄影技术。法国发明家尼埃普斯·尼埃普斯于 1826 年首次成功利用一种被称为“曝光”的方法拍摄了世界上最早的照片。
达盖尔剧照法(1839 年):法国人路易斯·达盖尔于 1839 年公开发表了他的达盖尔剧照法,是一种基于银版光敏化的摄影技术。技术简化了照片的制作过程,使照相术在 19 世纪中叶之前逐渐普及。
胶片摄影(19 世纪末至 20 世纪):1888 年,美国东曼·柯达公司(Eastman Kodak Company)推出了第一台使用的便携式相机“柯达 1 号”,该相机使用胶卷,使摄影大众化随着胶卷摄影的传播,照片成为日常生活中记录和回忆的重要手段。
黑白摄影和彩色摄影(20 世纪):到了 20 世纪,照片主要是黑白的,但后来随着技术的发展,彩色摄影也逐渐兴起。1930 年代,彩色胶片变得流行,使人们可以记录真实的世界的色彩。
数码摄影(20 世纪末至今):20 世纪末和 21 世纪,数字技术的飞速发展引领了摄影的新时代。数码摄影图像直接以数字形式捕捉和存储,消耗传统的胶卷。随着数码相机和智能手机的普及,人们可以随时随地拍摄、编辑和分享照片,彻底改变了摄影的方式。
社交媒体和照片共享(21 世纪):随着互联网和社交媒体的兴起,照片的共享变得更加广泛和便捷。人们可以通过各种在线平台,例如微博、微信、qq、抖音、站酷(我们可以分享设计师的动态)等,将自己的照片与他人分享世界分享,与朋友、家人和社区保持更紧密的联系。
2. 版权问题
版权问题是大家最头疼的问题,关于照片中的版权其实是和费用连接在一起的,因为版权问题就会涉及到费用问题。特别是关于在我们一些特殊行业中涉及到真人照片的应用,那版权就是一个头疼的大问题,经常会有很多公司花大价钱去购买专业的模特的“肖像权”,还有就是去各种图片网站去开通会员进行够购买,对于各平台收费的价格对于企业甚至个人来说都是一笔不小的支出。总结了一些我们使用照片关于避免产生版权问题的方法。
我们都知道 AI 出图也是通过学习、神经元网络等产出的,人工神经元网络,是一种基于生物神经网络结构和功能的计算模型。它就像计算机科学中用于接收、处理和传输信息的人造人类神经系统。
简单概述原理后我们就开始进行实际操作,在开始前我们需要进行一个规范的操作步骤这样方便我们脑海中构建一个清晰的框架。
①确定人物职业
在进行一般的创作时头脑风暴一定是首位,但是对于真人照片来说要更加准确就需要先确立职业,因为确立了职业就能减少过多的思考提前确立大方向,这样对于后续操作可以提升很大的效率。
这次我们就将职业选定为“销售”来进行大方向的绘制。这里教给大家一个小技巧,我们在选定职业后要合适的选择职业的特定名称,这样 Midjourney 才能更准确的识别目标词汇。
“销售”的英译“sales”(在我查阅相关资料时有一个方法就是在行业后面加上“man”、“woman”、“person”,当然仅限于大部分,有些特殊情况需要特殊对待。)
所以合适“销售员”的英译就用“salesperson”、“salesman”、“saleswoman”。还有一些职业销售的名片上会有“sales representative”(销售代表)下面是我分别只用了这些名词生成的“销售”(未加优化词)
可以看出来“salesrepresentative”会显得更加职业。
②头脑风暴
头脑风暴的开始我们就需要增加垫图了。随之而来带来一个很大的问题我们去哪找呢?我下面为大家推荐一些我经常使用的免费图片给大家使用。(在于很多大家都只知道,再此标注的目的是为了方便大家进行直接搜索。)
通过免版权网站筛选图片后我们可以将图片放入 Midjourney 进行垫图,这里我们搜索“销售”。为了更加准确的操作 Midjourney 生成更为准确的图片,我们将筛选条件通过以下 4 个方面进行筛选。
人物视图:就是指我们在海量照片中选择的人物是“正面”还是“侧面”等,这个需要根据需求来源确定。
所在地区:这里我们要区分地区的不然我们在 Midjourney 直接输入“salesrepresentative”会导致生成的不是我们国人的样子。
相貌特征:我们在筛选的时候想要找一个什么人物“性别”、“表情”等
背景清晰:在筛选的时候尽量选择背景清晰的图片,这里的清晰是指人物主题和背景有较为明显的区分,这样需要人物+场景的情况背景清晰的图片也会起到很好的效果同时也方便我们在后续做延展抠图的时候可以很好的提炼人物。
关于这 4 个方面我为大家总结了一些关键词,这样就避免大家再去一个一个再去实验。
③“Chat GPT”描述特征
我们可以通过人物的特征描述去形容我们想要生成的目标对象,这里我们可以借用“Chat GPT”来进行描述,在这里我们输入完常规的描述词后记得加上“并写出对应的“prompt”,这样“Chat GPT”所写的描述词完成后可以直接点击“Copy code”就可以直接复制了。
下面我们就可以在 Midjourney 中将“Chat GPT”所写的描述输入后便会生成以下图片,当然这还不是最终结果,我们可以和最后生成的图片对比看一下会有什么不同。这里是两段描述词:
④准确出图
在通过“Chat GPT”来描述特征后,我们掌握了关键词的描述,那么就来到最关键的一步怎样准确出图。
这里是关键词:
图片地址+Generate an image of a salesperson from China,Male, middle-aged, around 20 years old,Resolute, confident, composed, cunning,Inside a modernized specialty store,Soft sunlight coming through a floor-to-ceiling window,Dressed in a well-groomed black suit, displaying a healthy physique, and an approachable smile --q 2 --s 250 --v 5.2
通过上述操作这样我们就可以批量生成我们想要的图片了。如果大家觉得这些关键词太多,那么我为大家整理了几组我常用的后缀关键词,方便大家使用。下面 4 条案例我均是通过“人物主体描述(“人物”、“神态”、“场景”、“光线”、“特征”等)”后加上以下关键词:
当然这些仅供参考,如果小伙伴有更加优秀的方案大家可以一起交流!
通过 Midjourney 生成的真人照片,我们可以在活动页方面做延展。通过“Chat GPT”的描述+Midjourney 生成,我们就可以将所选人物扣出,这里有很多的抠图网站免费的有“remove”,还有 adobe 的官方抠图网站,我向大家推荐一个“美图秀秀”的抠图,我觉得它超级好用不过就是要收费!本次需求是负责一个职业面试官的活动页,下方是原型图。
①头脑风暴筛选相关元素
对于这里为什么不用“Chat GPT”去替我们脑暴,我当然也想过,但是我们还是尽量需要自己去思考等我们是在没有好的想法时可以请教“Chat GPT”。
通过头脑风暴筛选,确立了详细的元素目标“男”、“西装”、“城市”三个主要元素。使用“Chat GPT”的描述+Midjourney 生成就得到下面的人物。
关键词:Generate an image of a salesperson from China,Male, middle-aged, around 40 years old,Resolute, confident, composed, cunning,Inside a modernized specialty store,Soft sunlight coming through a floor-to-ceiling window,Dressed in a well-groomed black suit, displaying a healthy physique, and an approachable smile --q 2 --s 250 --v 5.2
这关键词是不是很熟悉?当然,这就是上面生成销售的图片。这次的销售就是我的需求,为什么用销售是因为我觉得“西装+职业”我脑海中最先想到的就是销售。需求是不会变动的,但是我们可以扩展思维。
②产出
接下来就是产出,这里我在原型图的基础上将信息排列进行了卡片的样式修改,这样更能聚焦视线方便浏览信息。
当然此次产出有很多不足,鉴于和需求方一直处于“云沟通”的状态所以这次总结下次再接再厉。
③总结
由于时间紧迫本次产出细节还有很大的不足,按钮与标签的问题,banner 和活动页的背景不一致等。这里大家把重点可以放在关心如何利用 AIGC 生成无版权等图片就可以。
回到文字第一段关于四张图片哪种是由 AI 生成的,我想用《肖申克的救赎》中的一句话来揭晓答案“Salvation lies within(救赎之道就在其中)”。这四张照片不论哪种是由 AI 生成的,在我们心里其实都已经存在答案了。AI 在最初起出现的时候,他并没有像现在一样完善对我们构不成威胁,但是在几个月前我们没意识到 AI 的进步速度竟会如此之快,我听到最多的两种声音围绕着“AI 会取代设计师”和“AI 就是骗人的”;AI 他到底会成为什么会不会取代设计师,我们其实不用太在意,我们选择了设计这条路或多或少都会对他有一定的热爱,那么关于 AI 的问题就请你抛之脑后,继续保持你对设计的热爱哪怕仅剩最后一点,去花更多时间在你的创意上,做出更多好的设计。我从未见到过哪些工具会取代人,我倒是见到是人的使用这些工具才有使用的价值,关于 AI“Salvation lies within(救赎之道就在其中)”。
原文作者:文轩没有大脑袋