来源:量子位
随便一张照片,就可生成3D头像。而且光线真实,任意角度可调。
这是苹果的最新黑科技生成框架FaceLit。
正如其名,FaceLit的特色就是可以将人脸“点亮”。
“自带光环”的FaceLit在易用性上也不输同类,甚至更胜一筹——
进行3D建模时,需要的照片素材无需专门选择角度,数量上也只需一张。
甚至对表情、发型、眼镜等元素进行调节时,也不需要额外素材。
而传统的头像合成工具或者需要多张图片才能工作,或者对照片角度有刁钻的要求。
正是凭借这一创新,FaceLit获得了3.5的FID评分,较同类产品直接高出了25%。
改进式EG3D合成人像,光线信息单独处理
下面就来看一下FaceLit具体是如何实现头像合成的。
深圳开出第一张区块链代理出口货物证明:7月26日消息,24日深圳地区开出了全国第一张基于区块链技术的“代理出口货物证明”,这是区块链技术在出口退税领域的首次应用,标志着深圳市税务局圆满完成了税务总局证明类业务区块链上链的试点任务。(凤凰网)[2021/7/26 1:16:00]
总的来说,苹果采用了将人物本体与光线分别处理再进行叠加的策略。
早期的三维人像合成工具在转换过程中可能产生形变。
而爆火的NeRF通过将场景拆分成具体因素,提高了3D图像合成效果,改善了这一问题。
但苹果团队认为,在可控性方面,NeRF仍存有不足之处。
于是,在EG3D框架的基础上,苹果创造了FaceLit的合成模型。
EG3D通过三平面解码器,赋予了二维卷积神经网络生成渲染3D模型所需深度参数的能力。
苹果团队对标准的EG3D训练方式进行了扩展,并将之转化成了FaceLit框架。
东港股份开具出北京市第一张区块链电子发票:东港股份公告称:在北京市税务局的主导下,子公司东港瑞宏提供了基于区块链技术的应用和支持,于2020年3月3日开具出了北京市第一张区块链电子发票。[2020/3/3]
△FaceLit与传统EG3D渲染流程对比图
标准的ED3G使用相机位置p参数作为基本输入参数。
在建立GAN2操作时,苹果在EG3D的基础上加入了光照参数l。
不同p(左→右)与l(上→下)值下的初始图像
苹果选择了经过球形谐波方式简化后的Phong反射模型作为处理光源的物理基础。
光照参数l就是在这一基础之上独立处理得到的。
在自然界中,反射包括镜面反射和漫反射两种形式。
动态 | 广州地铁今日开出第一张区块链电子发票:在国家税务总局广州市税务局的指导下,广州地铁在2020年1月1日开出第一张区块链电子发票,标志着区块链电子发票在广州市公共交通行业落地应用,预计1月中旬前将在广州地铁官方APP全面上线推广使用。区块链技术的集成应用在新的技术革新和产业变革中起着重要作用,区块链发票的实施推广,将进一步方便了广大市民乘坐地铁时开具发票。广州地铁表示,目前该发票功能仍在调试中,后续将加快系统的功能调试,完善开票功能,争取一月中旬前实现乘客通过广州地铁官方APP全自助开具区块链电子发票,为乘客带来更高效、更优质、更智能的出行体验。(科技日报)[2020/1/1]
△不同镜面反射率条件下的效果对比
因此,苹果在ED3G模型中加入了镜面反射解码器和漫反射解码器。
它们替代了可以直接得到颜色c、密度σ数据的三平面解码器。
动态 | 全国港口第一张区块链电子发票在招商港口蛇口集装箱码头(SCT)上线:据航运交易公布微博, 4月26日上午,招商港口在蛇口集装箱码头(SCT)举行全国港口第一张区块链电子发票上线仪式。10点50分,SCT副总经理姚胜兰宣布仪式启动。10点58分,货主代表劦福公司总经理曾杰办理提货办单手续并完成微信支付后,全国港口第一张区块链电子发票顺利生成。[2019/4/28]
△反射解码器流程示意图
通过对GAN2产生的数据进行再次解码,可以得到镜面反射率ks和漫反射率kd。
然后再通过两种反射着色器得到颜色c,密度σ则由漫反射解码器计算得出。
最终,FaceLit以与三平面解码器相同的参数渲染图像,并进行分辨率优化。
有的放矢设计训练策略,数据无需人工标注
生成框架已有,那就来到训练阶段,其特点在于训练过程中无需人工标注。
方法论层面,在训练时,团队使用了FFHQ、MetFaces和CelebA-HQ数据集。
对于不同的数据集,苹果使用了不同的训练方式。
FFHQ包含了7万余条人脸数据,其训练分为两个阶段:先在较低的分辨率下训练,再提高分辨率再次进行。
动态 | Reddit用户发起“比特币挑战” 一张图片隐藏310枚BTC:在国外论坛Reddit上,一名匿名用户于10月3日发起了一个寻找比特币的帖子,帖子名为“比特币挑战(Bitcoin Challenge)”。该挑战为一张带有密码的图片。用户宣称,该图片中隐藏着共计约310枚BTC(约合210万美金),谁最先找到密钥,就能获得这些比特币。 该图下方留下的文字显示,该用户发起这项挑战只是作为娱乐。据悉,在这幅图片中,这位匿名用户留下了4个比特币地址,这些地址的余额分别为0.1BTC、0.2BTC、0.31BTC以及310BTC。其中310BTC地址为:39uAUwEFDi5bBbdBm5ViD8sxDBBrz7SUP4。
截至目前,余额为0.1BTC的地址的密钥已经被找到。10月4号,一位名叫\"Lustre\"的人成功破解了这份画中的0.1BTC地址,并转走了其中的币。
此前消息,今年5月,网名为u/cryptogreetings的网友发布了一张神秘图片,为一道价值1 BTC的谜题。图片发布之后,尚未有人能够破解谜题。[2018/10/9]
对于包含2万数据量的CelebA-HQ,训练不需要分阶段进行。
而对于更小的MetFAces,则只需要通过ADA扩容的方式,使用预训练的FFHQ进行优化调整即可。
定性地看,训练结果在机位、光源和反射高光等方面都有出色的表现,图中的细节也有所增强。
△FaceLit生成的头像唇齿部位的细节进行了明显重构
定量结果同样表明,FaceLit在FID、KID等指标上均优于包括标准EG3D在内的传统生成方式。
在使用FFHQ作为训练集的条件下,各生成方式的表现如下表,不难看出FaceLit拥有最低的FID和KID值。
而相比于英伟达的StyleGAN2,FaceLit的表现依旧出色:
光线准确度方面,FaceLit在使用三种不同训练数据集的情况下,与人工设定的标准值平均均方误差均低于0.01。
网友:人们低估了苹果AI
消息发出后,便有网友认为“这是对更重磅产品的预热”。
更有网友直接推测,FaceLit的出现标示着人工智能将进军AR和VR领域,苹果的混合现实将最终实现商用……
也有网友认为,FaceLit不会商用,否则苹果才不会以论文的形式发表。
针对FaceLit本身,也有网友表示,除了LLM,其他都是浮云,他们如果不开发LLM,就没有未来。
但这位网友同时也说,苹果可能已经在做了。
相应的,也有网友称人们“低估了苹果在AI领域的深度”。
所以各位网友对苹果在AI领域还有什么样的期待呢?
论文地址:https://arxiv.org/abs/2303.15437
GitHub地址:https://github.com/apple/ml-facelit
参考链接:https://twitter.com/AlphaSignalAI/status/1648361623004774400
标签:FACEACECELLITfacedao币白皮书SPACEDOGE价格ECELLRealital Metaverse
对于经历了上一轮牛市的投资者来说,「以太坊基金会卖币」一直是一个颇为可靠的逃顶信号。另一个为人津津乐道的逃顶信号,即memeCoin的爆发。目前的加密市场,已经集齐这两点.
1900/1/1 0:00:00将现实生活中的体验带入一个全新的维度,ERMLABS专注于将现实生活中的娱乐及冒险体验以游戏独特架构设计扩展到元宇宙里.
1900/1/1 0:00:00来源:量子位原标题:《AI在劳动节淘汰7800打工人,永久的》“这不是演习,AI让人失业来真的了!”就在这个劳动节假期,科技巨头IBM宣布:暂缓可以被AI取代的岗位的招聘.
1900/1/1 0:00:00作者:中国银行软件中心?邓伟财随着科技发展的突飞猛进,尤其是金融科技发展水平的不断提升,金融科技的综合应用程度成为衡量商业银行竞争力和软实力的重要组成部分.
1900/1/1 0:00:00原文作者:MUSTAFA、CARL原文编译:深潮TechFlow与其他任何投资一样,加密货币也有其独特的风险和挑战,其中之一是了解代币的解锁计划如何影响价格波动和整体表现.
1900/1/1 0:00:00撰写:taetaehoho编译:深潮TechFlow在这篇文章中,1KX将分析链上游戏的潜力以及它们如何改变游戏产业,包括游戏制作、游戏玩法、社区建设和商业模式等方面.
1900/1/1 0:00:00