先插入广告:我团队还有两个NLP P6,P7工程师的HC,这方面感兴趣的同学可以关注公众号, 或是直接联系我投递简历。
以下是正文--------!
DALL-E
美国人应该都很喜欢《机器人总动员》这部皮克斯的动画片, 因为很多产品的名字, 都会以动画片中的Wall-E方式取名,例如半年前很火的AI作画,同时产生了几个很强大的产品, 一个是MidJourney,另一个是Dall-E,它们的主要功能就是输入一段文本, 然后大模型通过生成输入文本描述的图像,功能很强大, 甚至有人使用算法赢得了全球科幻科幻创作最高奖,赢了百万美金。
图:我在MidJourney尝试的结果
图:Dall-E结果
图:获得科罗拉多博览会数字作品第一名《空间歌剧院》
所以艺术家这个职业以后也很难干了。
3D生成
今天我们简单聊聊OpenAI的一个当前很挫, 但是很有前景的另一个产品:Point-E,其模型功能为输入一段描述性文本, 它直接根据描述生成一个3D点阵(点阵连接起来就是一个3D model),就类似于以前我们使用D3D建模, 只是现在使用文本输入就可以。
以下是试用链接:https://huggingface.co/spaces/openai/point-e
图:Point-E论文中的效果展示
以下是我去尝试这个模型当前的效果。 P.S. 现在真的很挫!!
图:Point-E 3D model generation,输入一段描述文本
图:Point-E 输出的3D model
论文可以参见:
Nichol A, Jun H, Dhariwal P, et al. Point-E: A System for Generating 3D Point Clouds from Complex Prompts[J]. arXiv preprint arXiv:2212.08751, 2022
后续趋势
但, 大家可以思考下, 如果某一天, 这个模型能够达到超高的效果, 那会有什么影响?以及产生什么样的机会?
3D建模从业人员失业
最直接的影响, 就是现在使用软件进行3D建模的从业人员失业, 虽然需要创作的3D 数字化内容会爆发, 但从传统从业人员的角度来说人员会急剧减少。当然这是这个算法产生的影响的极小的一方面。
元宇宙的重生
现在元宇宙算是虚了, 和两年前相比已经躺平了。但如果Point-E后续效果突飞猛进,那么虚拟世界创作会极度简单, 3D AIGC内容量爆发, 目前萧条的元宇宙概念及实际落地会大幅增加, 更多的人无所事事, 会更加频繁地进入元宇宙环境进行Kill Time,元宇宙届时必火!
甚至结合OpenAI的语音识别, 翻译,生成, 以及更多的智能产品(以后我会进一步介绍),内容的生产更加自动化, 甚至算法自发生成元宇宙中的世界,想象下骇客帝国, 以及Musk在推进的脑机接口, 其实并不久远。
这就是趋势, 大家需要思考如何融入这个趋势。