案例展示

这里有最新的公司动态,这里有最新的网站设计、移动端设计、网页相关内容与你分享!

Li Feifei的世界模式,大公司是否颠倒了??

说到这一点,他举了一个例子: DNA结构(双螺旋)是常见的三维结构。如果您只依靠单词来思考它的外观,那么您就无法理解它,当您真正“构建”时,您就可以理解它的美丽和复杂性。 还有碳分子,富勒烯,看起来像足球,只能通过空间的想象力和建模来理解。 因此,尽管语言模型很重要,但它是信息的压缩版本。它远非现实世界的整体代表。真正的情报应被理解并发展三维世界。 02 在这种情况下,我们不禁问:为什么模型如此重要? Li Feifei说,许多人第一次听到这个词时,他们觉得这有点抽象而深刻。峡谷将其理解为:AI对现实世界的三维理解。 这是什么意思? 像我们和我们在一起的人一样,我们可以说话,思考,厕所K,移动并看到这个世界的空间结构。 您看着桌子,知道它是平坦的,知道其中有什么,您可以四处走动,移动并把东西放置...这些动作背后是世界“模型”的大脑的发展。 所谓的“世界模型”正在尝试做到这一点:结合来自视觉,空间意义和行动等许多维度的信息,以真正模仿接近真实的世界。 他创建了一个特殊的图像: 游戏场景的一代。游戏的游戏玩家不会直接写一段段落来告诉您“有一座山,一条河流和一座桥”,但确实“构建”了这些元素以eof游戏,以便您可以走路,跳跃,跳跃并旅行。 AI世界模型正在尝试做类似的事情: 有必要“了解”形状,位置,与其他事物互动,甚至是其动态变化,并预测和操作它。 然后他说了一个特别有趣的想法: 如果机器人只能看到二维图像,则就像生活在一个纸界。未知前方的物体是靠近还是遥远,还是可以穿过门。只有当它具有三维理解时,它才能真正开始在这个世界上自由地移动。 因此,世界模型不仅是一个技术概念,还回答了一个更关键的问题:AI如何理解物理世界。 这正是Li Feifei强调的: 语言是高度压缩的信息,但它丢失了很多细节。要恢复现实世界,您必须具有建模空间的能力。换句话说,世界模型是AI实现“一般智能”的主要步骤。 说到这一点,他还分享了个人经验: 五年前,我的角膜受伤和立体声视觉失去了几个月。结果,他发现他很难开车。他知道他的汽车有多大以及汽车靠近道路的距进入别人。 他说: 正是在那一刻,我真正意识到了人类对世界的理解取决于一种空间感。这也使他更有说服力的是,如果AI没有这种空间理解能力,它始终可以保持“可见”,但“误解”。 03 理论最终应实施。问题是,生产世界模型需要哪些技术? Li Feifei说,这是一个非常复杂的过程,可以真正理解和重新开发三维世界。目前,许多主要的技术方向已暴露。 首先,它是从二维图像重建到三维的能力。 简而言之,如果您给AI几张照片,它可以恢复三维世界。例如,如果您从不同角度拍摄桌子的一些图片,则AI可能不太了解该桌子在太空中的放置方式,并且也可以“完成”侧面的侧面。 技术称为NERF,其全名IS神经辐射场。这有点学术,您可以将其视为“魔术相机”。就像您在难题中,给它几片,它可以猜测整个图片的外观。 拥有它是不够的。 尽管NERF是准确构建的,但它有一个问题:计算太大并且运行速度非常慢,并且不适用于实时应用。因此,另一种称为高斯平面表示的技术出现了。 什么是高斯拆分? 简单地说:将每个点视为一个小球,然后通过球的位置和颜色迅速描述整个场景。 您可以想象我在我年轻时玩过的构建块,但是如果您合并了,则可以建造Ng House。但是,这里的“构建块”是可以自由改革和移动的小光点。 这种方法的优点是快速速度和高渲染效率,它特别适合实时触点,例如播放,VR或Navig在机器人身上。 但是,这不是全部。 还有一项特别热门的技术,还为世界模型提供了支持,即经常接收的扩散模型(扩散模型)。 扩散模型首先用于产生图像,就像您今天看到的许多AI绘画工具一样,其阴影后面。但是它的功能不仅如此。它还将帮助AI更好地理解和生成三维空间内容。 例子: 如果您有模糊的图片,则可以通过连续的“ Denise”逐渐恢复扩散模型。有了同样的令牌,它也将帮助AI使一些粗糙的空间数据更加精致和更现实。 当然,除了模型本身的技术突破外,还有另一个重要点:从许多角度来看数据融合。 换句话说,AI不仅应该用图片或镜头看世界,而且应该像一个人一样,能够观察到同一件事从许多角度来看,然后全面判断运动的形状,位置和方法。 就像,您在房间里站在不同的位置,看一个杯子,并且每次看到的角度都不同,但是您的大脑不愿意包含这些信息以完全理解。 AI还需要这样做才能真正理解这种环境。因此,Nakias对您来说,技术是使AI能够像人类一样了解空间的能力的步骤。 但是,这些都是基本功能。 如果我们不仅要看到和构建AI,还要预测世界上的变化,我们需要引入另一个重要方向:物理模拟和动态建模。 换句话说,您不仅知道某物在哪里,而且还需要猜测它将如何移至下一个,例如:当风爆炸时,叶子会改变,门将在明天推下后返回,或者当球向下楼梯时会发生什么。 看似简单的常识很大AI的挑战。 因此,为了产生世界模型,许多方法都需要共同努力,包括NERF,高斯表示,扩散模型,多视图融合和物理模型。 聆听后,我意识到AI应该像一个人一样理解世界,能够观察,插入信息,人际关系的原因并从许多角度预测变化。它的背后是技术组合中的一组复杂的打击。 04 因为AI已经开始了解三维世界,所以可以实施其功能吗?现在使用了吗? Li Feifei说:是的。应用程序场景超出了我们的想象。 例如,在游戏行业中;许多游戏公司不再依靠程序员逐行编写代码来模型场景,但是直接让AI根据许多图片或视频自动提出了一个现实的三维世界。 例如,建筑业。 过去,当经理会画渲染时NG,建模和渲染可能需要几天。如今,在世界模型技术的帮助下,AI可以生产整个空间的三维结构几分钟,也可以模仿不同角度闪耀的阳光的影响。 还有一个机器人。如果机器人只有二维的景色,那就像是生活在纸界上,而且不知道前对象是否靠近或远处,以及它们是否可以穿过那扇门。 那是吗?当然。 数字双胞胎还为现实世界构建了虚拟脚本。工厂,建筑物甚至城市都可以通过AI来创建相应的数字世界,以进行预测,测试和优化。 示例:我们首先可以模仿虚拟火灾撤离世界,以查看存在问题的地方,然后改善真相,而不是等到事情发生之前。 此外,他特别提到的方向是创意产业。 创造力本质上是视觉的。许多艺术家,设计师和建筑师受到对空间的理解和想象的启发。当AI也具有这种能力时,它不仅是一种工具,而且是创作者的合作伙伴。 因此,您会看到,应用程序不仅保留在技术论文中,而且正在悄悄地改变许多行业的运作方式。 Li Feifei还指出,这是生产力的新革命: 过去,我们曾经根据语言描述世界。现在,我们可以直接让AI“看到”和“重建”世界。 05 看来世界模型应用的PSROSECT非常广泛,因此在多大程度上真正使用了?今天有什么挑战? Li Feifei说,该方向是正确的,仍然存在许多尚未解决的问题。 有三个要点。首先是数据的问题。 如果您希望AI了解三维世界,需要看到足够的真实场景,以及深度信息,空间结构,照明变化等。换句话说,如果AI想“理解”世界,那么前提是您需要清晰而全面地给它“书籍书”。但是现在这些数据要么很难获得,要么成本太高。 其次,计算强度仍然是一个大问题。 当前有许多技术,例如Nerf或Gaussian符号,具有良好的结果,但是有很高的要求源代码来源。运行型号需要很长时间,需要非常昂贵的图形卡。它在实验室中是可以接受的,但是大规模实施它显然是不现实的。 另一个挑战是侵犯的能力。这是什么意思? 如今,大多数AI模型只能在特定环境中效果很好。当他们进入陌生的情况时,他们容易“不理解”,“承认错误的人”或“走错的道路”。 就像当您训练狗识别红球时,但是当它改变蓝色球时,它永远不会识别它们。 AI也是如此,我也是如此T需要更强的灵活性才能真正进入数千个家庭。 此外,只希望使用强算法是不够的。您需要打开所有硬件,软件,数据和应用程序方案;这不是一个人或公司可以做的事情,而是整个行业需要进步的变化。 因此,即使世界模型的方向是正确的,前景很有吸引力,但现在就像一个刚起步的初学者一样,在真正的成人和广泛使用之前,还有很长的路要走。 由于世界模型仍在路上,为什么要推动它(世界实验室)? Li Feifei说,他想要一个可以结合许多能力的团队,这是他最初打算在世界上找到实验室的意图之一。 目前,团队成员来自全球,包括计算机视觉专家,图形研究人员,扩散模型开发人员以及对物理模拟和机器人控制的电视体。 他还指出,AI的发展一直是o这一天,它不会被“独自战斗”摧毁。过去,当一个人写算法时,它变得流行了。现在,要创建一个像世界模型这样的系统项目,来自不同背景的人们应该一起工作。 他举了一个例子: 团队中有一个名叫Manu的研究人员,并具有深层nerf的积累和高斯符号。另一个同事是克里斯托夫(Christophor),他还经历了扩散模型和AI的发展。 他们没有复制别人所做的事情,而是探索了一条新的道路。这条路上没有准备好的地图,他们只能依靠每个人走路时画画。 当然,这是因为他更坚信AI研究的未来范式是从“单一研究”转移到“多歧义”,并从“个人英雄”转变为“集体智慧”。 06 拥有这样的团队具有不同的背景也意味着对AI的外观会有更多不同的看法。 作为科学家和商人,Li Feifei Also法律工作。他还讨论了有关人工智能与人文科学之间关系,AI与教育之间的影响以及在法律和道德等社会系统中如何出现的一些观点。 他说:很长一段时间以来,当人们提到AI时,他们就想到了技术本身,类似于如何训练模型,提高准确性和提供算法。 但是实际上,真正决定AI可以走多远和连续的原因不仅是技术,而且坑也是它与社会之间的关系。 以教育为例: 许多学校仍在“教学教学如何编写代码”和“如何修复参数”中教授AI方法。他认为,未来的人工智能教育应注意培养学生和社会责任的批判性思维。 因为AI不仅是一种工具,还会影响人们的决定,改变社会结构,甚至重塑工作形式。 因此,我们需要培养的不仅是e知道如何编写模型,也知道那些可以考虑应该训练该模型以及其效果的人。换句话说,AI教育不仅可能教授“如何做”,而且还指出了“为什么要这样做”和“如果应该是Notwin”。 关于法律,他认为: AI越来越多地参与判断现实世界。示例:招聘筛查,信用分析甚至司法判断。然后问题是:如果AI做出了错误的决定,谁将负责? 这是开发人员吗?用户?还是AI本身?也许,我们应该提前设计规则的界限,否则在出现问题时补救问题可能为时已晚。 最后,他还谈到了一个特别有趣的观点: 许多人认为AI是一种冷的数学和算法。他认为,AI是人类价值观和技术能力的结合。我们创建什么样的人工智能反映了我们想要成为什么样的社会。 因此,AI一直是Devel直到今天,它需要联合参与NG哲学家,历史学家,社会学家,教育工作者和立法者。 由于AI是整个社会体系的变化,因此我们不禁要问:“空间智能”和“世界模型”将在哪里转到Li Feifei的眼中?您对未来的AI开发有什么样的愿景? 他说,他内心有很多想法,他在计算机上进行计算机研究的早期就种了骨头。 那时,我在想: 如果有一天,AI真的了解三维世界,它如何使用这种能力?仅仅是为了玩游戏,构建地图还是做更多的事情? 如果有一天,AI真的了解三维世界,它如何使用这种能力?仅仅是为了玩游戏,构建地图还是做更多的事情? 他认为,未来AI仅是“可见的”,并且“也可以理解”;不仅是“重建世界”,而且“参与世界”;不仅是“执行任务”,而且还要“ coop”与人一起。” 换句话说:AI的最终目的不是取代人们,而是成为物理世界中人们的明智扩展。 换句话说:AI的最终目的不是取代人们,而是成为物理世界中人们的明智扩展。 他举了一个例子:因为眼镜让我们更清楚地看到,轮椅可以帮助我们继续前进,而AI将成为我们理解和运行世界的新工具。 例子: 在医疗领域,AI可以帮助医生更准确地判断手术的道路;在建筑行业,这将有助于快速设计来开发虚拟模型。 在教育中,它可以是一个可以“输入”的知识空间,使学生能够真正看到“分子结构,历史场景,甚至宇宙的发展;这不是科幻小说,而是技术进化正在发生。 关于AGI,他还提到了一个非常关键的观点: 我们今天讨论的世界模式是未来的第一步通用人工智能(AGI);真正的AGI不仅依靠语言或文本来理解世界,而且还需要空间理解,动态推理,互动和创造力。 我们今天讨论的世界模型是未来通用人工智能(AGI)的第一步。真正的AGI不仅依靠语言或文本来理解世界,而且还需要NG空间理解,动态推理,互动和创造力。 这些是世界模型代表的方向。 因此,空间智能和世界模型不仅是一种技术探索,而且还可以重新定义人类计算机关系,社会发展和未来的生活方式。 从二维到三维的语言,Li Feifei描述了AI更了解人们,更接近现实并能够更好地与我们生活和合作的时期。 这些宏观的声音是否更难实现? 从顶部看底部,这并不是很容易。如果我们更改角度并从底部到顶部的角度怎么办?在中国,Byte,Tencent,Alibaba和Baidu等顶级公司正试图在其ProductStong AI TOC上增加几只眼睛。 当AI打开天空之眼时,它会迫使空间加速吗?换句话说,最好让AI首先了解世界。这不是一个选择吗?有趣的 - 友好的问题,我仍在观察。你怎么认为? 信息参考: [1]。 A16Z。 (2025年6月4日)。 Fei-Fei Li如何为现实世界重建AI; YouTube:https://youtu.be/fqgu016alvo?si=rrze7rbvsjr3ephff返回sohu以查看更多
下一篇:没有了

Copyright © 2024-2026 dafa888黄金版官网_大发黄金版app下载 版权所有

网站地图

沪ICP备32623652号-1