来源:特赞Tezign(微信号:Tezign)
采访:张自灵 赵洋
随着人工智能时代的到来,设计与人工智能的纠葛,艺术与科技的博弈,越来越频繁地现身热门话题榜。而在设计人工智能领域,阿里巴巴已经开始加速探索。
就像那句广为流传的“Talk is cheap, show me the code”,他们也真的在去年“双11”期间,show 出了 1.7 亿由阿里的设计人工智能产品“鲁班”设计的 banner(广告横幅)。所以,怀着对科技既畏又爱的心,我们找 “鲁班”的产品设计负责人乐(yue)乘聊了聊。
阿里巴巴AI设计项目负责人乐乘(吴春松)
Q= 特赞 Tezign
A= 乐乘
Q: 请您先自我介绍一下吧?
A: 我在阿里花名乐乘,是淘宝 UED 的产品设计师,也是阿里人工智能设计产品“鲁班”的负责人,我们做的事情是人工智能技术与商业设计结合,并且落地成商业产品。
Q: 您之前的专业就是设计吗?在阿里多久了?
A: 不是的,我大学是学建筑环境,07 年毕业后“不务正业”进入体验设计行业。我们这一批做交互的人很多不是科班出身,有很多心理学、工业设计背景的。我大学时开始接触互联网,自己设计网页,也做过站长。毕业后,我先在一个媒体网站做了两年交互,09 年加入淘宝,也就是阿里开始实施“大淘宝”战略的时候。那会儿体验设计在国内刚刚兴起,腾讯和淘宝两个 UED 团队在圈内影响力很大,专业度很高,机缘巧合,最后选择了淘宝。
Q: 加入阿里之后的经历是怎样的?
A: 我已经在阿里工作 8 年了,前几年主要做搜索,后来开始做手淘。2015 年“双11”后,我们在内部发起了一个人工智能设计的项目,主要开发的产品就是“鲁班”。我们是大公司内部创业加研究新技术的团队,随着产品和团队逐渐壮大,现在团队演进为“阿里智能设计实验室”。
阿里智能设计实验室 Logo
Q: 这个团队成立的契机是什么?
A: 团队其实是自下而上发起的,在 15 年的“双11”我是会场项目负责人,跟工程和算法两个团队有很密切的合作,也在“双11”期间建立了深厚的“战斗感情”。
在 15 年之前的“双11”,商品推荐都是人来控制的,由运营决定给用户推荐什么产品,而 15 年那次“双11”,是阿里第一次基于算法和大数据,为用户做大规模的、个性化的商品推荐,叫做“千人千面”,是阿里流量分发模式很大的升级和转型。
“双11”结束后,我们(设计、工程和算法团队)就聚在一起,商量下一年要做些什么。我们当时想,我们已经做到的个性化推荐,但都是基于白底图商品推荐,能不能往前迈一步,让强营销导向的广告资源位的设计也“千人千面”呢?
从纯商品个性化跨到广告资源位个性化,中间几个关键的技术点打通之后,我们就着手做了。
“鲁班”做出来的banner
Q: 都是哪几个关键技术点?
A: 一是图像算法“抠图”。因为高质量的广告设计需要把商品图片抠出来,放到精美的设计主题里。以前都是设计师给商品抠图后再做设计,现在我们用机器做海量设计,就得让机器来做这个事情。我们跟阿里搜索部门做图像切割的算法团队合作,处理海量的商品自动抠图。
第二点是把设计变成“数据”。一张广告设计图片是像素组成的“信息”,不是“数据”。我们利用机器把商品、文字和设计主题进行在线合成,这样每张广告图片就带上了商品信息,可以根据消费者偏好进行个性化投放。所以鲁班产品上线初期,我们请设计师根据活动主题做了大批量风格确定的模板,证明了这种模式投放效果可以大幅提升点击率。
第三点就是让机器学习设计。靠“人肉设计模板”度过了第一个阶段,但长远发展角度我们必须让机器来做设计。大概是 16 年 8 月份开始的,有一位之前负责淘宝“拍立淘”(在淘宝内通过图片搜索找同款,随拍随找)产品开发的图像算法专家加入进来,主导整个智能设计的算法框架。
设计数据化
Q: 中间有踩坑吗?
A: 有的,因为我们在做一件很新的事情,行业里没有什么参考对象,只能不断试错。刚开始的时候,我们的数据不太够,就制定了很强的设计规则去控制,结果就是机器要么跑不出设计结果,要么设计出来的结果很失控。设计是有无穷可能性的,靠弱数据强规则必然走不通。意识到这一点以后,我们就集中精力去解决数据问题,把内部设计师电脑里的设计图和供应商的设计图都收集过来。
Q: 这么多图片散落在这么多电脑里,怎么收集和整理啊?
A: 我们有自己开发的设计协同工具“设计板”,有点类似Slack(一款协作办公应用),但是是专门用于设计协同的。这样才能方便我们大批量、规模化的找到这些数据。
Q: 收集起来也还是很乱啊。
A: 是的,所以就遇到了第二个挑战,就是数据清洗和输入机器,因为收集过来的数据是很杂乱的。比如“双11”期间“魔性”的设计风格跟无印良品这种“性冷淡”风格差异很大,这是完全不一样的品牌调性和设计需求。我们花了很大的力气去整理和建立了一套数据体系去管理设计数据,让机器生产出更匹配的结果。
设计智能化
Q: 有人说“鲁班”没有达到设计人工智能的阶段,只是“大数据生产”,您如何看待这个说法?
A: 现在讲 AI ,外界很难感受到机器的智能含量多高、体现在什么地方,但我也不太同意“大数据生产”这一说,我觉得这个疑问涉及两个核心的,也是最基本的问题:一是什么叫设计智能,二是怎么评价机器是否具备了设计智能。
AI 目前有几个主要方向,一个是“识别”,像语音识别、图像识别;另一个是“生成”,也就是我们在做的,从无到有创造东西,让机器能根据请求生成符合特定要求的结果。我们把我们的智能设计定位为:可控的图像生成技术。我们可以结合技术框架和原理来理解,我会在 UCAN 大会上详细讲。
Q: 那在这里先给我们简单讲讲?
A: 也可以。在整个生成过程中,有4个核心步骤。
第一步,让机器理解设计是什么构成的:我们通过人工数据标注,对设计的原始文件中的图层做分类,对元素做标注。设计专家团队也会提炼设计手法和风格。通过数据的方式告诉机器这些元素为什么可以放在一起,我们把专家的经验和知识通过数据输入。这部分核心是深度序列学习的算法模型。
第二步,建立元素中心:当机器学习到设计框架后,需要大量的生产资料。我们会建立元素库,通过机器做图像特征提取,然后分类,再通过人工控制图像质量以及版权问题,我们买了有版权的图库,也是希望从一开始就避免版权方面的纠纷。
第三步,生成的系统:原理有点像 Alpha Go 下围棋。我们在设计框架上构建起虚拟画布,类似棋盘,生成的系统把元素中心的元素往棋盘放,在这里我们采用了“强化学习”,就好像你在家里放一台扫地机器人,让它自己跑,跑个几圈,它自己会知道哪里有障碍要避开。在强化学习的过程中,机器参考原始样本,通过不断尝试,得到一些反馈,然后从中学习到什么样的设计是对的、好的。
第四步,评估的系统:我们会抓取大量设计的成品,从“美学”和“商业”两个方面进行评估。美学上的评估由人来进行,这方面有专业众包公司;商业上的评估就是看投放出去的点击率浏览量等等。
4个核心步骤
Q: 明白了,所以您觉得“鲁班”的最大优势是什么?
A: 我觉得“鲁班”是商业和技术两方面的比较好的结合产物。首先在技术深度方面,它有门槛很高的一套系统,另外在商业方面,它的确能通过“智能化”和“个性化”,实现商业价值最大化,颠覆传统方式。
Q: 听说去年“双11”,“鲁班”设计了 1.7 亿个 banner,你怎么看这个“历史事件”?
A: 其实这 1.7 亿个 banner 是有设计强干预的,因为“双11”的风格是比较确定而且需要严格执行,所以设计师制作了很多“双11”特定风格的固定模板。机器在这个基础上,把调整尺寸这些行为进行优化,节省了尺寸拓版的人力。用机器生成亿级设计从而带来商业效果提升,总体来说也是一次非常成功的应用实践。我想未来的“双11”仍然会是设计师带着机器做设计的模式,重大活动中设计机器是提升效率的助理角色。
Q: 取得了这么大的成功,阿里内部如何评价“鲁班”呢?另外,“鲁班”把 banner 都“撸”完了,原来做 banner 的人怎么办?
A: 引用阿里 CEO 的话——“鲁班是数据业务化的代表”,之前我们有很多数据,但都是闲置的或者利用效率不高的,比如海量的商品图,而“鲁班”把数据变成了业务,通过大规模设计加精准投放,提高每个广告位的资源效率,带动了流量的效率和业务价值,点击率是翻倍的,收益也接近翻倍。人员倒没有出现缩减,只是做的事情有调整了,要学习这套系统,学习如何训练机器,同时在美学方面做把控。
从“设计思维”到“数据思维”
Q: 说到这里,好像漏了一个很重要的问题,为什么这个产品要叫“鲁班”?听说是“撸一个 banner ”的谐音?
A:(笑)当时我们开玩笑说要 “让天下没有难撸的banner ”,谐音就是“鲁班”,后来发现简直太合适了,鲁班不仅本身是个伟大的工匠,也是很多工具的发明人,所以他的理念跟我们做的事情是不谋而合的,我们也希望发明工具,让设计师更好地工作。
“鲁班”的 logo
Q: 感觉你们也是一群大神,你们团队现在有多大?
A: 我们现在有十几个人。
Q: 只有十几个?!
A: 对,有设计、算法和工程三个部分,成员大部分是 80 后,现在也有 90 后加入了,我们对计算机视觉领域的人一直是求贤若渴的(欢迎大家投简历)。因为是在阿里内部独立做研究,所以团队氛围跟很多小型创业公司很像,大家都很有热情、很果断、行动力很强。
Q: 现在看来,你们的方向已经很清晰,那下个阶段要攻克的挑战是什么?
A: 主要有两个吧,一是要让智能设计去影响阿里设计生态,让“鲁班”能服务百万量级的商家和设计师。一开始在内部推进“鲁班”的时候,我们也面临过阻力。传统的方式就是,设计一个 banner,放很多商品,显得很热闹,而“鲁班”做出来的 banner 上就是单件商品,但与消费者是相关的,因为是基于算法精准推荐的,是你会感兴趣的,只是这样就要把商品放大、显眼,可能在设计上就不够美。但最后,我们让数据说话,确实后者给业务带来了很好的增长。这个教育过程是比较长的,在内部我们可以做,但面对百万商家和设计师如何去做?这是我们的挑战。
第二个挑战是数据算法本身的持续升级。AI 行业每年都会有很大的变化,新的技术不断涌现出来,如何跟上最新的技术?这也是我们始终不能松懈的点。
转载请在文章开头和结尾显眼处标注:作者、出处和链接。不按规范转载侵权必究。
未经授权严禁转载,授权事宜请联系作者本人,侵权必究。
本文禁止转载,侵权必究。
授权事宜请至数英微信公众号(ID: digitaling) 后台授权,侵权必究。
评论
评论
推荐评论
暂无评论哦,快来评论一下吧!
全部评论(0条)