咨询电话
400-123-4567
手 机:13988999988
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号
电 话:400-123-4567
传 真:+86-123-4567
邮 箱:[email protected]
地 址:广东省广州市天河区88号
微信扫一扫
AI 靠单图生成 3D 世界:李飞飞空间智能首秀,可
作者:[db:作者]日期:2024/12/09 17:11浏览:
感激IT之家网友 西窗往事 的线索送达!就在刚,李飞飞空间智能首个名目忽然宣布:仅凭仗 1 张图,就能天生一个 3D 游戏天下的 AI 体系!重点在于,天生的 3D 天下存在交互性。可能像玩游戏那样,自在地挪动相机来摸索这个 3D 天下,浅景深、希区柯克变焦等操纵均可行。随意输入一张图:除了这张图本体,可摸索的 3D 天下里,全部货色都是 AI 天生的:这些场景在阅读器中及时衬着,装备了可控的摄像机后果跟可调理的模仿景深(DoF)。你乃至能够转变此中物体色彩,静态调剂配景光影,在场景中拔出其余工具。别的,之前年夜少数天生模子猜测的是像素,而这个 AI 体系直接猜测 3D 场景。以是场景在你移开视线再返来时不会产生变更,而且遵守基础的 3D 多少何物理规矩。网友们直接炸开锅,批评区“难以相信”一词直接刷屏。此中不乏 Shopify 开创人 Tobi Lutke 等著名人士点赞:另有不少网友以为这直接为 VR 翻开了新天下。官方则表现“这仅仅是 3D 原生天生 AI 将来的一个缩影”:咱们正在尽力尽快将这项技巧交到用户手中!李飞飞自己也第一时光分享了这项结果并表现:无论怎样实践化这个主意,用言语很难描写经由过程一张照片或一句话天生的 3D 场景互动的休会,盼望各人爱好。现在候补名单请求已开启,有内容创作者曾经用上了。爱慕的口水不争气地从眼角落了上去。Beyond the input image官方博文表现,明天,World labs 迈出了通往空间智能的第一步:宣布一个从单张图片天生 3D 天下的 AI 体系。Beyond the input image, all is generated。并且是输入任何图片。并且是可能互动的 3D 天下 —— 用户能够经由过程 W / A / S / D 键来把持高低阁下视角,或许用鼠标拖动画面来逛这个天生的天下。官网博文中放了良多个能够试玩的 demo。此次真的推举各人都去试玩一下,上手休会跟看视频 or 动图的感触十分的纷歧样。好,成绩来了,这个 AI 体系天生的 3D 天下另有什么值得探索的细节之处?拍照机后果World Labs 表现,一旦天生,这个 3D 天下就会在阅读器中及时衬着,给人的感到跟在看一个虚构摄像头似的。并且,用户可能精准地把持这个摄像头。所谓“精准把持”,有 2 种弄法,一是可能模仿景深后果,也就是只能清楚对焦间隔相机必定间隔的物体。二是能模仿滑动变焦(Dolly Zoom),也就是片子拍摄技能中十分经典的希区柯克变焦。它的特色是“镜头中的主体巨细稳定,而配景巨细转变”。良多驴友去西藏、新疆玩儿的时间都盼望用希区柯克变焦拍视频,有很强的视觉打击力。在 World Labs 展现中,后果如下(不外在这个弄法里,没措施把持视角):3D 后果World Labs 表现,年夜少数天生模子猜测的都是像素,与它们差别,咱这个 AI 猜测的是 3D 场景。官方博文列举了三点利益:第一,长久事实。一旦天生一个天下,它就会始终存在。不会由于你看向其余视角,再看返来,原视角的场景就会转变了。第二,及时把持。天生场景后,用户能够经由过程键盘或鼠标把持,及时在这个 3D 天下畅游挪动。你乃至能够细心察看一朵花的细节,或许在某个处所黑暗察看,用天主视角留神这个天下的一举一动。第三,遵守准确的多少何规矩。这个 AI 体系天生的天下,是遵照 3D 聚集物理基础规矩的。某些 AI 天生的视频,固然后果很梦核,但可不咱的这种深度的实在感哟(doge)。官方博文中还写道,发明一个可视化 3D 场景,最简略的措施是绘制深度图。图中每个像素的色彩,都是由它跟摄像头的间隔来决议的。固然了,用户能够应用 3D 场景构造来构建互动后果 ——单击就能与场景互了,包含但不限于忽然给场景打个聚光灯。动画后果?那也是 so easy 啦。走进绘画天下团队还玩儿了一把,以“全新的方法”休会一些经典的艺术作品。全新,不只在于可互动的交互方法,还在于就靠输入出来的那一张图,就能补全原画里不的局部。而后酿成 3D 天下。这是梵高的《夜晚露天咖啡座》:这是爱德华・霍普的《夜行者》:发明性的任务流团队表现,3D 天下天生能够十分天然地跟别的 AI 东西相联合。这让创作者们能够用他们曾经用顺手的东西感触新的任务流休会。举个栗子:能够先用文生图模子,从文本天下离开图像天下。由于差别模子有各自善于的作风特色,3D 天下能够把这些作风迁移、继续过去。在统一 prompt 下,输入差别作风的文生图模子天生的图片,能够出生差别的 3D 天下:一个充斥活气的卡透风格青少年寝室,床上铺着五彩斑斓的毯子,桌子上混乱地摆放着电脑,墙上挂着海报,散落着活动东西。一把吉他靠在墙上,旁边铺着一块舒服的斑纹地毯。窗户透进的光芒给房间增加了一丝暖和跟芳华的气味。World Labs 跟空间智能“World Labs”公司,由斯坦福年夜学教学、AI 教母李飞飞在往年 4 月创建。这也是她被曝出的初次创业。而她的创业偏向是一个新观点 —— 空间智能,即:视觉化为洞察;瞥见成为懂得;懂得招致举动。在李飞飞看来,这是“处理人工智能困难的要害拼图”。只用了 3 个月时光,公司就冲破了 10 亿美元估值,成为新晋独角兽。公然材料表现,a16z、NEA 跟 Radical Ventures 是领投方,Adobe、AMD、Databricks,以及老黄的英伟达也都在投资者之列。团体投资者中也不乏年夜佬:Karpathy、Jeff Dean、Hinton……往年 5 月,李飞飞有一场公然的 15 分钟 TED 报告。她洋洋洒洒,分享了对空间智能的更多思考,要点包含:视觉才能被以为激发了寒武纪年夜暴发 —— 一个植物物种大批进入化石记载的时代。最初是主动休会,简略让光芒进入的定位,很快变得愈加自动,神经体系开端退化…… 这些变更催生了智能。多年来,我始终在说照相跟懂得不是一回事。明天,我想再弥补一点:仅仅看是不敷的。看,是为了举动跟进修。假如咱们想让 AI 超出以后才能,咱们不只想要可能看到跟谈话的 AI,咱们还想要可能举动的 AI。空间智能的最新里程碑是,教盘算机看到、进修、举动,并进修看到跟举动得更好。跟着空间智能的减速提高,一个新时期在这个良性轮回中正在咱们面前开展。这种轮回正在催化呆板人进修,这是任何须要懂得跟与 3D 天下互动的具身智能体系的要害构成局部。据报道,该公司的目的客户包含视频游戏开辟商跟片子制片厂。除了互动场景之外,World Labs 还打算开辟一些对艺术家、计划师、开辟职员、片子制造人跟工程师等专业人士有效的东西。现在随同着空间智能首个名目的宣布,他们要做的事也逐步具象化了起来。但 World Labs 表现,现在宣布的只是一个“晚期预览”:咱们正在尽力改良咱们天生的天下的范围跟真切度,并实验新的方法让用户与之互动。参考链接:https://www.worldlabs.ai/blog原题目《李飞飞空间智能首秀:AI 靠单图天生 3D 天下,可摸索,遵守基础物理多少何规矩》告白申明:文内含有的对外跳转链接(包含不限于超链接、二维码、口令等情势),用于通报更多信息,节俭甄选时光,成果仅供参考,IT之家全部文章均包括本申明。
申明:新浪网独家稿件,未经受权制止转载。 -->
相关文章
- 2024/12/09AI 靠单图生成 3D 世界:李飞飞空间智能首
- 2024/12/07撤回IPO后欣诺通信欲“卖身”高凌信息,
- 2024/12/06竞争加剧!报道:亚马逊劝说云客户远离
- 2024/12/05多名券商高管因违规买卖证券被罚