谷歌4D世界模型来了,比SOTA快300倍!谷歌4D世界模型来了,比SOTA快300倍! \u003cdiv class=\"rich_media_content\"\u003e\u003c!--NO_AD_ERROR_5_2I1--\u003e\u003ch3 data-mpa-powered-by=\"yiban.io\" style=\"background-color: rgb(255, 255, 255); color: rgb(34, 34, 34); letter-spacing: 0.544px; outline: 0px; visibility: visible\"\u003e\u003csection data-id=\"88402\" data-tools=\"135编辑器\" style=\"line-height: 27.2px; outline: 0px; visibility: visible; widows: 1\"\u003e\u003csection data-id=\"88402\" data-tools=\"135编辑器\" style=\"letter-spacing: 0.544px; line-height: 27.2px; outline: 0px; visibility: visible\"\u003e\u003csection data-style=\"line-height: 1.8; text-align: justify; font-size: 15px; letter-spacing: 0px; color: rgb(117, 114, 114);white-space: normal;\" style=\"outline: 0px; visibility: visible\"\u003e\u003csection style=\"outline: 0px; visibility: visible\"\u003e\u003csection style=\"margin-bottom: 8px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003c!--IMG_0--\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/h3\u003e\u003ch3 style=\"background-color: rgb(255, 255, 255); color: rgb(34, 34, 34); letter-spacing: 0.544px; outline: 0px; visibility: visible\"\u003e\u003csection data-id=\"88402\" data-tools=\"135编辑器\" style=\"line-height: 27.2px; outline: 0px; visibility: visible; widows: 1\"\u003e\u003csection data-id=\"88402\" data-tools=\"135编辑器\" style=\"letter-spacing: 0.544px; line-height: 27.2px; outline: 0px; visibility: visible\"\u003e\u003csection data-style=\"line-height: 1.8; text-align: justify; font-size: 15px; letter-spacing: 0px; color: rgb(117, 114, 114);white-space: normal;\" style=\"outline: 0px; visibility: visible\"\u003e\u003csection style=\"outline: 0px; visibility: visible\"\u003e\u003csection style=\"outline: 0px; visibility: visible\"\u003e\u003chr style=\"font-size: 17px; letter-spacing: 0.544px; outline: 0px; visibility: visible\"/\u003e\u003cp style=\"font-size: 17px; letter-spacing: 0.544px; line-height: 1.75em; margin-left: 8px; margin-right: 8px; margin-top: -1.2em; outline: 0px; visibility: visible\"\u003e\u003cspan leaf=\"\"\u003e\u003cbr/\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"font-size: 17px; letter-spacing: 0.544px; line-height: 1.75em; margin-left: 8px; margin-right: 8px; margin-top: -1.2em; outline: 0px; text-align: center; visibility: visible\"\u003e\u003cspan style=\"letter-spacing: 1px; outline: 0px; visibility: visible\"\u003e\u003cstrong style=\"font-size: 1em; outline: 0px; text-decoration: inherit; visibility: visible\"\u003e\u003cspan style=\"background-color: rgb(127, 127, 127); color: rgb(255, 255, 255); font-size: 18px; font-weight: inherit; line-height: 1.4; outline: 0px; text-decoration: inherit; visibility: visible\"\u003e\u003cspan leaf=\"\"\u003e \u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cstrong style=\"font-size: 1em; outline: 0px; text-decoration: inherit; visibility: visible\"\u003e\u003cspan style=\"background-color: rgb(127, 127, 127); color: rgb(255, 255, 255); font-size: 18px; font-weight: inherit; line-height: 1.4; outline: 0px; text-decoration: inherit; visibility: visible\"\u003e\u003cspan leaf=\"\"\u003e新智元报道 \u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/section\u003e\u003c/h3\u003e\u003csection style=\"background-color: rgb(255, 255, 255); color: rgb(34, 34, 34); letter-spacing: 0.544px; line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px; min-height: 1em; outline: 0px; text-align: center; visibility: visible\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 12px; letter-spacing: 1px; outline: 0px; visibility: visible\"\u003e\u003cspan leaf=\"\"\u003e编辑:艾伦\u003c/span\u003e\u003c/span\u003e\u003c/section\u003e\u003csection powered-by=\"xiumi.us\" style=\"background-color: rgb(255, 255, 255); color: rgb(34, 34, 34); letter-spacing: 0.544px; margin-bottom: 0px; outline: 0px; visibility: visible\"\u003e\u003csection style=\"outline: 0px; visibility: visible\"\u003e\u003csection style=\"outline: 0px; visibility: visible\"\u003e\u003ch5 style=\"background-color: rgb(248, 248, 248); border-radius: 3px; color: rgb(0, 0, 0); font-size: 14px; letter-spacing: 0.544px; line-height: 1.75em; margin-left: 8px; margin-right: 8px; margin-top: 10px; outline: 0px; padding: 10px; visibility: visible; word-break: break-all !important; word-spacing: 1px !important\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px; outline: 0px; visibility: visible\"\u003e\u003cstrong style=\"outline: 0px; visibility: visible\"\u003e\u003cspan leaf=\"\"\u003e【新智元导读】\u003c/span\u003e\u003cspan leaf=\"\"\u003e\u003cspan style=\"font-weight: normal\" textstyle=\"\"\u003e谷歌 DeepMind 发布 \u003c!--VERTICAL_CARD_BEGIN_0--\u003eD4RT\u003c!--VERTICAL_CARD_END_0--\u003e,彻底颠覆了动态 \u003c!--VERTICAL_CARD_BEGIN_1--\u003e4D 重建\u003c!--VERTICAL_CARD_END_1--\u003e范式。它抛弃了复杂的传统流水线,用一个统一的「\u003c!--VERTICAL_CARD_BEGIN_2--\u003e时空查询\u003c!--VERTICAL_CARD_END_2--\u003e」接口,同时搞定\u003c!--VERTICAL_CARD_BEGIN_3--\u003e全像素追踪\u003c!--VERTICAL_CARD_END_3--\u003e、深度估计与相机位姿。不仅精度屠榜,速度更比现有 SOTA 快出 300 倍。这是\u003c!--VERTICAL_CARD_BEGIN_4--\u003e具身智能\u003c!--VERTICAL_CARD_END_4--\u003e与自动驾驶以及 AR 的新基石,AI 终于能像人类一样,实时看懂这个流动的世界。\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/h5\u003e\u003c/section\u003e\u003c/section\u003e\u003c!--NO_AD_0--\u003e\u003c!--EOP_0--\u003e\u003c/section\u003e\u003c!--PARAGRAPH_0--\u003e\u003cp data-pm-slice=\"0 0 []\" style=\"line-height: 1.75em; margin: 24px 8px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e如果是几年前,你问一位计算机视觉工程师:「我想把这段视频里的所有东西——无论它是静止的房子还是奔跑的狗——都在 3D 世界里重建出来,并且还能随时知道它们下一秒会去哪儿,需要多久?」\u003c/span\u003e\u003c/span\u003e\u003c!--NO_AD_1--\u003e\u003c!--EOP_1--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_1--\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e他大概会递给你一根烟,让你先去买几块顶级显卡,然后给你画一个由四五个不同模型拼凑起来的流程图:先算光流,再算深度,再估相机位姿,最后还得用一晚上的时间去跑优化,祈祷结果别崩。\u003c/span\u003e\u003c/span\u003e\u003c!--NO_AD_2--\u003e\u003c!--EOP_2--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_2--\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: left\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e但谷歌 DeepMind 刚刚发布的 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e(Dynamic 4D Reconstruction and Tracking),试图终结这种混乱。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_3--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这篇论文在计算机视觉领域扔下了一枚关于「效率革命」的重磅炸弹。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它把原本割裂的 3D 重建、相机追踪、动态物体捕捉,统一成了一个极简的「查询」动作。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_4--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e更重要的是,它的速度比现有 \u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eSOTA\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e技术快了 18 到 300 倍\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection data-mpa-action-id=\"mkqf9b0ye5c\" data-pm-slice=\"0 0 []\" nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: center\"\u003e\u003c!--IMG_5--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 48px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e如果在你的认知里,高质量的 4D 重建还是好莱坞特效工作室里那些昂贵且缓慢的渲染农场,耗费漫长的时间等待生成完毕,那么 D4RT 正在把这种能力变成一种可以塞进机器人大脑甚至 AR 眼镜里的实时直觉。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 0px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003eDemo 演示\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e为了理解 D4RT 到底做到了什么,我们需要先看一眼它眼中的世界。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e在论文展示的演示中,最直观的震撼来自于对「动态混乱」的驾驭能力。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e想象一下这个画面:一只天鹅在水面上划过,或者一朵花在风中快速绽放。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection data-pm-slice=\"0 0 []\" data-tool=\"markdown2wechat编辑器\" data-website=\"https://aizhuanqian.com\"\u003e\u003cp data-tool=\"mdnice编辑器\" style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e传统的 3D 重建算法(比如 MegaSaM 或 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"\\pi^3\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 1.91ex; vertical-align: -0.025ex; width: 2.203ex\" viewBox=\"0 -833.2 973.6 844.2\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msup\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M132 -11Q98 -11 98 22V33L111 61Q186 219 220 334L228 358H196Q158 358 142 355T103 336Q92 329 81 318T62 297T53 285Q51 284 38 284Q19 284 19 294Q19 300 38 329T93 391T164 429Q171 431 389 431Q549 431 553 430Q573 423 573 402Q573 371 541 360Q535 358 472 358H408L405 341Q393 269 393 222Q393 170 402 129T421 65T431 37Q431 20 417 5T381 -10Q370 -10 363 -7T347 17T331 77Q330 86 330 121Q330 170 339 226T357 318T367 358H269L268 354Q268 351 249 275T206 114T175 17Q164 -11 132 -11Z\" data-c=\"3C0\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mn\" transform=\"translate(570, 363) scale(0.707)\"\u003e\u003cpath d=\"M127 463Q100 463 85 480T69 524Q69 579 117 622T233 665Q268 665 277 664Q351 652 390 611T430 522Q430 470 396 421T302 350L299 348Q299 347 308 345T337 336T375 315Q457 262 457 175Q457 96 395 37T238 -22Q158 -22 100 21T42 130Q42 158 60 175T105 193Q133 193 151 175T169 130Q169 119 166 110T159 94T148 82T136 74T126 70T118 67L114 66Q165 21 238 21Q293 21 321 74Q338 107 338 175V195Q338 290 274 322Q259 328 213 329L171 330L168 332Q166 335 166 348Q166 366 174 366Q202 366 232 371Q266 376 294 413T322 525V533Q322 590 287 612Q265 626 240 626Q208 626 181 615T143 592T132 580H135Q138 579 143 578T153 573T165 566T175 555T183 540T186 520Q186 498 172 481T127 463Z\" data-c=\"33\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e)处理这种场景通常是一场灾难——因为它们假设世界是静止的,所以它们往往会在 3D 空间里留下一串「重影」,就像老式胶片重叠曝光一样,天鹅变成了长着几十个脖子的怪物,或者花朵直接变成了一团无法辨认的噪点。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c!--NO_AD_3--\u003e\u003c!--EOP_3--\u003e\u003c/section\u003e\u003c!--PARAGRAPH_3--\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e但 D4RT 给出的结果极其干净。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它不仅可以精准还原天鹅的 3D 形态,还完美剥离了相机的运动和天鹅自身的运动。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e在它的视野里,时间变成了一个可以随意拖动的滑块。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_9--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e更令人印象深刻的是它的\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e全像素追踪\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e能力。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e你可以点击视频中花瓣上的任意一个像素,D4RT 就能画出这个点在过去和未来的完整 3D 轨迹,哪怕这个点在中间几帧被蜜蜂遮挡了,或者跑到了画面之外,模型依然能根据上下文「脑补」出它的去向。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_10--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这种视觉效果给人的感觉是:AI 不再是在一帧帧地「看」视频,而是把整段视频吞下去,在大脑里生成了一个完整的、流动的全息全景图,然后你可以随意从任何角度、任何时间去检视它。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection data-mpa-action-id=\"mkqf9jo71fjw\" data-pm-slice=\"0 0 []\" nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px; text-align: center\"\u003e\u003c!--IMG_11--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: center\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 13px; letter-spacing: 1px\" textstyle=\"\"\u003e模型能力对比图\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 24px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 0px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e拆解「神话」\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e是真的快,还是文字游戏?\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e科技公司发论文,数据通常都很漂亮。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e作为观察者,我们需要剥离 PR 滤镜,看看数据背后的定语。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e谷歌声称 D4RT 比之前的 SOTA 快了 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e300 倍\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e,处理一分钟的视频只需要 5 秒钟。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"color: rgb(255, 104, 39); font-size: 15px; font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e这是真的吗?\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e答案是:\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"color: rgb(255, 104, 39); font-size: 15px; font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e在特定维度上,是真的。\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这里的「300倍」指的是\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"color: rgb(255, 104, 39); font-size: 15px; font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e吞吐量\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e,具体来说是「在保持相同帧率(FPS)的前提下,模型能同时追踪多少条 3D 轨迹」。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cul class=\"list-paddingleft-1\" style=\"margin-left: 8px; margin-right: 8px\"\u003e\u003cli\u003e\u003cp style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 0px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e数据对比:\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e在 24 FPS 的标准电影帧率下,之前的强者 SpatialTrackerV2 只能同时追踪 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e84\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e条轨迹,再多就卡了;而 D4RT 可以轻松处理 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e1570\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e条。如果是和 DELTA 这种更慢的模型比,那就是 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e314 倍\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e的差距。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/li\u003e\u003c/ul\u003e\u003csection data-mpa-action-id=\"mkqf9r2j13ao\" data-pm-slice=\"0 0 []\" nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: center\"\u003e\u003c!--IMG_15--\u003e\u003c/section\u003e\u003cul class=\"list-paddingleft-1\" style=\"margin-left: 8px; margin-right: 8px\"\u003e\u003cli\u003e\u003cp style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 0px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e实际意义:\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这意味着之前的技术可能只能盯着画面里的主角(比如一个人),而 D4RT 可以同时盯着背景里走动的路人、飘落的树叶和远处的车流——即所谓的「全像素级感知」。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/li\u003e\u003c/ul\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"color: rgb(255, 104, 39); font-size: 15px; font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e它比同类技术强在哪儿?\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e目前市面上的 4D 重建技术主要分两派:\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003col class=\"list-paddingleft-1\" start=\"1\" style=\"margin-left: 8px; margin-right: 8px\"\u003e\u003cli\u003e\u003cp style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 0px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e「拼装派」\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e(如 MegaSaM):把深度估计、光流、分割等多个现成模型串起来。虽然效果不错,但不仅慢,而且一旦一个环节出错(比如光流飘了),后面全完。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/li\u003e\u003c/ol\u003e\u003col class=\"list-paddingleft-1\" start=\"2\" style=\"margin-left: 8px; margin-right: 8px\"\u003e\u003cli\u003e\u003cp style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 0px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e「多头派」\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e(如 VGGT):虽然是一个大模型,但为了输出不同的任务(深度、位姿、点云),需要挂载不同的解码头,结构臃肿。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/li\u003e\u003c/ol\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 的牛,在于它做到了\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e架构层面的统一\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它不需要为深度单独做一个解码器,也不需要为位姿单独做一个。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它只用\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e同一个接口\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e解决所有问题。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_16--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e有没有代价?\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e当然有。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 的「快」主要体现在推理阶段。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e在训练阶段,它依然是一个庞然大物。它的编码器使用了 ViT-g,拥有 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e10 亿\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e参数,并且需要在 64 个 TPU 芯片上训练两天。\u003c!--AI_AD_2000--\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这绝不是普通开发者在自家车库里能复现的玩具,它是典型的「大厂重武器」。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 48px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 0px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e技术解码\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e把 4D 重建变成「搜索引擎」\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e那么,D4RT 到底是怎么做到的?\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e论文的核心逻辑可以用一句话概括:\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e先全局「阅读」视频,再按需「搜索」答案。\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e不再逐帧解码,而是「全局记忆」\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e传统的视频处理往往是线性的,处理第 10 帧时可能已经「忘」了第 1 帧的细节。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: left\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 的第一步是使用一个巨大的 Transformer 编码器(Encoder),把整段视频压缩成一个\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e\u003c!--VERTICAL_CARD_BEGIN_5--\u003e全局场景表征\u003c!--VERTICAL_CARD_END_5--\u003e(Global Scene Representation, F)\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e。\u003c/span\u003e\u003c/span\u003e\u003c!--NO_AD_4--\u003e\u003c!--EOP_4--\u003e\u003c/p\u003e\u003c!--PARAGRAPH_4--\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e你可以把这个\u003c/span\u003e\u003cspan style=\"font-size: 15px; font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e F\u003c/span\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e 想象成 AI 对这段视频形成的「长期记忆」。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 48px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e一旦这个记忆生成了,原本庞大的视频数据就被浓缩在了这里。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 0px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e「哪里不会点哪里」的查询机制\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这是 D4RT 最天才的设计。它发明了一种通用的查询(Query)语言。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: left\"\u003e\u003cspan style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan mpa-font-style=\"mkqfa3w2jun\" style=\"font-size: 15px; font-weight: bold; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e当 AI 想要知道某个像素的信息时,它会向解码器(Decoder)发送一个查询 q:\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection data-pm-slice=\"0 0 []\" data-tool=\"markdown2wechat编辑器\" data-website=\"https://aizhuanqian.com\" style=\"-webkit-text-stroke-width: 0px; color: black; font-size: 16px; font-style: normal; font-variant-caps: normal; font-weight: 400; letter-spacing: 0px; line-height: 1.6; orphans: 2; overflow-wrap: break-word; padding: 0px 10px; text-align: left; text-decoration: none; text-decoration-style: solid; text-decoration-thickness: auto; text-indent: 0px; text-transform: none; white-space: normal; widows: 2; word-break: break-word; word-spacing: 0px\"\u003e\u003cspan data-tool=\"mdnice编辑器\" style=\"cursor: pointer\"\u003e\u003csection data-formula=\"q = (u, v, t_{src}, t_{tgt}, t_{cam})\" data-formula-type=\"block-equation\" role=\"presentation\" style=\"display: block; line-height: 1.75em; margin-left: 8px; margin-right: 8px; overflow: auto hidden; text-align: center\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 2.364ex; max-width: 300% !important; vertical-align: -0.667ex; width: 22.049ex\" viewBox=\"0 -750 9745.8 1045\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M33 157Q33 258 109 349T280 441Q340 441 372 389Q373 390 377 395T388 406T404 418Q438 442 450 442Q454 442 457 439T460 434Q460 425 391 149Q320 -135 320 -139Q320 -147 365 -148H390Q396 -156 396 -157T393 -175Q389 -188 383 -194H370Q339 -192 262 -192Q234 -192 211 -192T174 -192T157 -193Q143 -193 143 -185Q143 -182 145 -170Q149 -154 152 -151T172 -148Q220 -148 230 -141Q238 -136 258 -53T279 32Q279 33 272 29Q224 -10 172 -10Q117 -10 75 30T33 157ZM352 326Q329 405 277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q233 26 290 98L298 109L352 326Z\" data-c=\"71\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(737.8, 0)\"\u003e\u003cpath d=\"M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z\" data-c=\"3D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(1793.6, 0)\"\u003e\u003cpath d=\"M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z\" data-c=\"28\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(2182.6, 0)\"\u003e\u003cpath d=\"M21 287Q21 295 30 318T55 370T99 420T158 442Q204 442 227 417T250 358Q250 340 216 246T182 105Q182 62 196 45T238 27T291 44T328 78L339 95Q341 99 377 247Q407 367 413 387T427 416Q444 431 463 431Q480 431 488 421T496 402L420 84Q419 79 419 68Q419 43 426 35T447 26Q469 29 482 57T512 145Q514 153 532 153Q551 153 551 144Q550 139 549 130T540 98T523 55T498 17T462 -8Q454 -10 438 -10Q372 -10 347 46Q345 45 336 36T318 21T296 6T267 -6T233 -11Q189 -11 155 7Q103 38 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"75\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(2754.6, 0)\"\u003e\u003cpath d=\"M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z\" data-c=\"2C\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(3199.2, 0)\"\u003e\u003cpath d=\"M173 380Q173 405 154 405Q130 405 104 376T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Q21 294 29 316T53 368T97 419T160 441Q202 441 225 417T249 361Q249 344 246 335Q246 329 231 291T200 202T182 113Q182 86 187 69Q200 26 250 26Q287 26 319 60T369 139T398 222T409 277Q409 300 401 317T383 343T365 361T357 383Q357 405 376 424T417 443Q436 443 451 425T467 367Q467 340 455 284T418 159T347 40T241 -11Q177 -11 139 22Q102 54 102 117Q102 148 110 181T151 298Q173 362 173 380Z\" data-c=\"76\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(3684.2, 0)\"\u003e\u003cpath d=\"M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z\" data-c=\"2C\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"msub\" transform=\"translate(4128.9, 0)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z\" data-c=\"73\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(469, 0)\"\u003e\u003cpath d=\"M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"72\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(920, 0)\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(5496.6, 0)\"\u003e\u003cpath d=\"M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z\" data-c=\"2C\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"msub\" transform=\"translate(5941.3, 0)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(361, 0)\"\u003e\u003cpath d=\"M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z\" data-c=\"67\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(838, 0)\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(7200.1, 0)\"\u003e\u003cpath d=\"M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z\" data-c=\"2C\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"msub\" transform=\"translate(7644.8, 0)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(433, 0)\"\u003e\u003cpath d=\"M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z\" data-c=\"61\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(962, 0)\"\u003e\u003cpath d=\"M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"6D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(9356.8, 0)\"\u003e\u003cpath d=\"M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z\" data-c=\"29\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/section\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfa3w222ky\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 15px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e这个公式翻译成人话就是:\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp data-tool=\"mdnice编辑器\" style=\"color: black; font-size: 16px; line-height: 1.75em; margin: 0px 8px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan mpa-font-style=\"mkqfa3w21yd2\" style=\"font-size: 15px\"\u003e\u003cspan leaf=\"\"\u003e\u003cspan style=\"font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e「\u003c/span\u003e\u003c/span\u003e\u003cspan mpa-font-style=\"mkqfamcx1cyp\" style=\"font-size: 15px; font-weight: bold; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003e请告诉我:在 \u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{src}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 1.773ex; vertical-align: -0.357ex; width: 3.094ex\" viewBox=\"0 -626 1367.7 783.8\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z\" data-c=\"73\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(469, 0)\"\u003e\u003cpath d=\"M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"72\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(920, 0)\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx5s8\" style=\"font-size: 15px\"\u003e\u003cspan style=\"font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e这一帧图像上坐标为 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"(u, v)\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 2.262ex; vertical-align: -0.566ex; width: 5.158ex\" viewBox=\"0 -750 2279.7 1000\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"mo\"\u003e\u003cpath d=\"M94 250Q94 319 104 381T127 488T164 576T202 643T244 695T277 729T302 750H315H319Q333 750 333 741Q333 738 316 720T275 667T226 581T184 443T167 250T184 58T225 -81T274 -167T316 -220T333 -241Q333 -250 318 -250H315H302L274 -226Q180 -141 137 -14T94 250Z\" data-c=\"28\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(389, 0)\"\u003e\u003cpath d=\"M21 287Q21 295 30 318T55 370T99 420T158 442Q204 442 227 417T250 358Q250 340 216 246T182 105Q182 62 196 45T238 27T291 44T328 78L339 95Q341 99 377 247Q407 367 413 387T427 416Q444 431 463 431Q480 431 488 421T496 402L420 84Q419 79 419 68Q419 43 426 35T447 26Q469 29 482 57T512 145Q514 153 532 153Q551 153 551 144Q550 139 549 130T540 98T523 55T498 17T462 -8Q454 -10 438 -10Q372 -10 347 46Q345 45 336 36T318 21T296 6T267 -6T233 -11Q189 -11 155 7Q103 38 103 113Q103 170 138 262T173 379Q173 380 173 381Q173 390 173 393T169 400T158 404H154Q131 404 112 385T82 344T65 302T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"75\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(961, 0)\"\u003e\u003cpath d=\"M78 35T78 60T94 103T137 121Q165 121 187 96T210 8Q210 -27 201 -60T180 -117T154 -158T130 -185T117 -194Q113 -194 104 -185T95 -172Q95 -168 106 -156T131 -126T157 -76T173 -3V9L172 8Q170 7 167 6T161 3T152 1T140 0Q113 0 96 17Z\" data-c=\"2C\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(1405.7, 0)\"\u003e\u003cpath d=\"M173 380Q173 405 154 405Q130 405 104 376T61 287Q60 286 59 284T58 281T56 279T53 278T49 278T41 278H27Q21 284 21 287Q21 294 29 316T53 368T97 419T160 441Q202 441 225 417T249 361Q249 344 246 335Q246 329 231 291T200 202T182 113Q182 86 187 69Q200 26 250 26Q287 26 319 60T369 139T398 222T409 277Q409 300 401 317T383 343T365 361T357 383Q357 405 376 424T417 443Q436 443 451 425T467 367Q467 340 455 284T418 159T347 40T241 -11Q177 -11 139 22Q102 54 102 117Q102 148 110 181T151 298Q173 362 173 380Z\" data-c=\"76\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(1890.7, 0)\"\u003e\u003cpath d=\"M60 749L64 750Q69 750 74 750H86L114 726Q208 641 251 514T294 250Q294 182 284 119T261 12T224 -76T186 -143T145 -194T113 -227T90 -246Q87 -249 86 -250H74Q66 -250 63 -250T58 -247T55 -238Q56 -237 66 -225Q221 -64 221 250T66 725Q56 737 55 738Q55 746 60 749Z\" data-c=\"29\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx7ny\" style=\"font-size: 15px\"\u003e\u003cspan style=\"font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e的那个点,它在 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{tgt}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 2.084ex; vertical-align: -0.667ex; width: 2.848ex\" viewBox=\"0 -626 1258.8 921\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(361, 0)\"\u003e\u003cpath d=\"M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z\" data-c=\"67\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(838, 0)\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx1ki7\" style=\"font-size: 15px\"\u003e\u003cspan style=\"font-weight: bold; letter-spacing: 1px\" textstyle=\"\"\u003e这个时间时刻,如果从 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{cam}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 1.773ex; vertical-align: -0.357ex; width: 3.873ex\" viewBox=\"0 -626 1712.1 783.8\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(433, 0)\"\u003e\u003cpath d=\"M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z\" data-c=\"61\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(962, 0)\"\u003e\u003cpath d=\"M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"6D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan mpa-font-style=\"mkqfamcxv3y\" style=\"font-size: 15px\"\u003e\u003cspan style=\"font-weight: bold\"\u003e\u003cspan leaf=\"\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e这个相机的视角看过去,它的 3D 坐标在哪里?」\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cul class=\"list-paddingleft-1\" style=\"color: black; list-style-type: disc; margin: 8px; padding-left: 25px\"\u003e\u003cli\u003e\u003csection style=\"color: rgb(1, 1, 1); font-weight: 500; line-height: 26px; margin-bottom: 5px; margin-top: 5px; text-align: left\"\u003e\u003cp style=\"color: black; font-size: 16px; line-height: 1.75em; margin-bottom: 0px; margin-top: 0px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcxok1\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e如果你想生成深度图:就问「现在这个点在现在的相机里多远?」(让 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{src}=t_{tgt}=t_{cam}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 2.084ex; vertical-align: -0.667ex; width: 15.85ex\" viewBox=\"0 -626 7005.7 921\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z\" data-c=\"73\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(469, 0)\"\u003e\u003cpath d=\"M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"72\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(920, 0)\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(1645.5, 0)\"\u003e\u003cpath d=\"M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z\" data-c=\"3D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"msub\" transform=\"translate(2701.3, 0)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(361, 0)\"\u003e\u003cpath d=\"M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z\" data-c=\"67\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(838, 0)\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003cg data-mml-node=\"mo\" transform=\"translate(4237.9, 0)\"\u003e\u003cpath d=\"M56 347Q56 360 70 367H707Q722 359 722 347Q722 336 708 328L390 327H72Q56 332 56 347ZM56 153Q56 168 72 173H708Q722 163 722 153Q722 140 707 133H70Q56 140 56 153Z\" data-c=\"3D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"msub\" transform=\"translate(5293.6, 0)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(433, 0)\"\u003e\u003cpath d=\"M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z\" data-c=\"61\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(962, 0)\"\u003e\u003cpath d=\"M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"6D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx1ifj\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e)。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003c/li\u003e\u003cli\u003e\u003csection style=\"color: rgb(1, 1, 1); font-weight: 500; line-height: 26px; margin-bottom: 5px; margin-top: 5px; text-align: left\"\u003e\u003cp style=\"color: black; font-size: 16px; line-height: 1.75em; margin-bottom: 0px; margin-top: 0px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx21ew\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e如果你想做轨迹追踪:就问「这个点在第 1 帧、第 2 帧……第 N 帧都在哪?」(固定 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{src}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 1.773ex; vertical-align: -0.357ex; width: 3.094ex\" viewBox=\"0 -626 1367.7 783.8\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M131 289Q131 321 147 354T203 415T300 442Q362 442 390 415T419 355Q419 323 402 308T364 292Q351 292 340 300T328 326Q328 342 337 354T354 372T367 378Q368 378 368 379Q368 382 361 388T336 399T297 405Q249 405 227 379T204 326Q204 301 223 291T278 274T330 259Q396 230 396 163Q396 135 385 107T352 51T289 7T195 -10Q118 -10 86 19T53 87Q53 126 74 143T118 160Q133 160 146 151T160 120Q160 94 142 76T111 58Q109 57 108 57T107 55Q108 52 115 47T146 34T201 27Q237 27 263 38T301 66T318 97T323 122Q323 150 302 164T254 181T195 196T148 231Q131 256 131 289Z\" data-c=\"73\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(469, 0)\"\u003e\u003cpath d=\"M21 287Q22 290 23 295T28 317T38 348T53 381T73 411T99 433T132 442Q161 442 183 430T214 408T225 388Q227 382 228 382T236 389Q284 441 347 441H350Q398 441 422 400Q430 381 430 363Q430 333 417 315T391 292T366 288Q346 288 334 299T322 328Q322 376 378 392Q356 405 342 405Q286 405 239 331Q229 315 224 298T190 165Q156 25 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 114 189T154 366Q154 405 128 405Q107 405 92 377T68 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"72\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(920, 0)\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx1o18\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e,改变 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{tgt}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 2.084ex; vertical-align: -0.667ex; width: 2.848ex\" viewBox=\"0 -626 1258.8 921\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(361, 0)\"\u003e\u003cpath d=\"M311 43Q296 30 267 15T206 0Q143 0 105 45T66 160Q66 265 143 353T314 442Q361 442 401 394L404 398Q406 401 409 404T418 412T431 419T447 422Q461 422 470 413T480 394Q480 379 423 152T363 -80Q345 -134 286 -169T151 -205Q10 -205 10 -137Q10 -111 28 -91T74 -71Q89 -71 102 -80T116 -111Q116 -121 114 -130T107 -144T99 -154T92 -162L90 -164H91Q101 -167 151 -167Q189 -167 211 -155Q234 -144 254 -122T282 -75Q288 -56 298 -13Q311 35 311 43ZM384 328L380 339Q377 350 375 354T369 368T359 382T346 393T328 402T306 405Q262 405 221 352Q191 313 171 233T151 117Q151 38 213 38Q269 38 323 108L331 118L384 328Z\" data-c=\"67\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(838, 0)\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcx1zc1\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e)。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"color: rgb(1, 1, 1); font-weight: 500; line-height: 26px; margin-bottom: 5px; margin-top: 5px; text-align: left\"\u003e\u003cp style=\"color: black; font-size: 16px; line-height: 1.75em; margin-bottom: 0px; margin-top: 0px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan leaf=\"\"\u003e\u003c!--IMG_26--\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003c/li\u003e\u003cli\u003e\u003csection style=\"color: rgb(1, 1, 1); font-weight: 500; line-height: 26px; margin-bottom: 5px; margin-top: 5px; text-align: left\"\u003e\u003cp style=\"color: black; font-size: 16px; line-height: 1.75em; margin-bottom: 0px; margin-top: 0px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan leaf=\"\" mpa-font-style=\"mkqfamcxne2\" style=\"font-size: 15px\"\u003e\u003cspan style=\"letter-spacing: 1px\" textstyle=\"\"\u003e如果你想重建点云:就问「视频里所有点在同一时刻的世界坐标在哪?」(把所有点都映射到同一个 \u003c/span\u003e\u003c/span\u003e\u003cspan style=\"cursor: pointer\"\u003e\u003cspan data-formula=\"t_{cam}\" data-formula-type=\"inline-equation\" role=\"presentation\" style=\"\"\u003e\u003csvg aria-hidden=\"true\" focusable=\"false\" role=\"img\" style=\"height: 1.773ex; vertical-align: -0.357ex; width: 3.873ex\" viewBox=\"0 -626 1712.1 783.8\" xmlns=\"http://www.w3.org/2000/svg\"\u003e\u003cg fill=\"currentColor\" stroke=\"currentColor\" stroke-width=\"0\" transform=\"matrix(1 0 0 -1 0 0)\"\u003e\u003cg data-mml-node=\"math\"\u003e\u003cg data-mml-node=\"msub\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M26 385Q19 392 19 395Q19 399 22 411T27 425Q29 430 36 430T87 431H140L159 511Q162 522 166 540T173 566T179 586T187 603T197 615T211 624T229 626Q247 625 254 615T261 596Q261 589 252 549T232 470L222 433Q222 431 272 431H323Q330 424 330 420Q330 398 317 385H210L174 240Q135 80 135 68Q135 26 162 26Q197 26 230 60T283 144Q285 150 288 151T303 153H307Q322 153 322 145Q322 142 319 133Q314 117 301 95T267 48T216 6T155 -11Q125 -11 98 4T59 56Q57 64 57 83V101L92 241Q127 382 128 383Q128 385 77 385H26Z\" data-c=\"74\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mjx-texclass=\"ORD\" data-mml-node=\"TeXAtom\" transform=\"translate(361, -150) scale(0.707)\"\u003e\u003cg data-mml-node=\"mi\"\u003e\u003cpath d=\"M34 159Q34 268 120 355T306 442Q362 442 394 418T427 355Q427 326 408 306T360 285Q341 285 330 295T319 325T330 359T352 380T366 386H367Q367 388 361 392T340 400T306 404Q276 404 249 390Q228 381 206 359Q162 315 142 235T121 119Q121 73 147 50Q169 26 205 26H209Q321 26 394 111Q403 121 406 121Q410 121 419 112T429 98T420 83T391 55T346 25T282 0T202 -11Q127 -11 81 37T34 159Z\" data-c=\"63\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(433, 0)\"\u003e\u003cpath d=\"M33 157Q33 258 109 349T280 441Q331 441 370 392Q386 422 416 422Q429 422 439 414T449 394Q449 381 412 234T374 68Q374 43 381 35T402 26Q411 27 422 35Q443 55 463 131Q469 151 473 152Q475 153 483 153H487Q506 153 506 144Q506 138 501 117T481 63T449 13Q436 0 417 -8Q409 -10 393 -10Q359 -10 336 5T306 36L300 51Q299 52 296 50Q294 48 292 46Q233 -10 172 -10Q117 -10 75 30T33 157ZM351 328Q351 334 346 350T323 385T277 405Q242 405 210 374T160 293Q131 214 119 129Q119 126 119 118T118 106Q118 61 136 44T179 26Q217 26 254 59T298 110Q300 114 325 217T351 328Z\" data-c=\"61\"\u003e\u003c/path\u003e\u003c/g\u003e\u003cg data-mml-node=\"mi\" transform=\"translate(962, 0)\"\u003e\u003cpath d=\"M21 287Q22 293 24 303T36 341T56 388T88 425T132 442T175 435T205 417T221 395T229 376L231 369Q231 367 232 367L243 378Q303 442 384 442Q401 442 415 440T441 433T460 423T475 411T485 398T493 385T497 373T500 364T502 357L510 367Q573 442 659 442Q713 442 746 415T780 336Q780 285 742 178T704 50Q705 36 709 31T724 26Q752 26 776 56T815 138Q818 149 821 151T837 153Q857 153 857 145Q857 144 853 130Q845 101 831 73T785 17T716 -10Q669 -10 648 17T627 73Q627 92 663 193T700 345Q700 404 656 404H651Q565 404 506 303L499 291L466 157Q433 26 428 16Q415 -11 385 -11Q372 -11 364 -4T353 8T350 18Q350 29 384 161L420 307Q423 322 423 345Q423 404 379 404H374Q288 404 229 303L222 291L189 157Q156 26 151 16Q138 -11 108 -11Q95 -11 87 -5T76 7T74 17Q74 30 112 181Q151 335 151 342Q154 357 154 369Q154 405 129 405Q107 405 92 377T69 316T57 280Q55 278 41 278H27Q21 284 21 287Z\" data-c=\"6D\"\u003e\u003c/path\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/g\u003e\u003c/svg\u003e\u003c/span\u003e\u003c/span\u003e\u003cspan\u003e\u003cspan mpa-font-style=\"mkqfamcxnpk\" style=\"font-size: 15px; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003e)。\u003c/span\u003e\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"color: rgb(1, 1, 1); font-weight: 500; line-height: 26px; margin-bottom: 5px; margin-top: 5px; text-align: left\"\u003e\u003cp style=\"color: black; font-size: 16px; line-height: 26px; margin-bottom: 0px; margin-top: 0px; padding-bottom: 8px; padding-top: 8px\"\u003e\u003cspan leaf=\"\"\u003e\u003c!--IMG_29--\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/p\u003e\u003c/section\u003e\u003c/li\u003e\u003c/ul\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e\u003c!--VERTICAL_CARD_BEGIN_6--\u003e并行计算\u003c!--VERTICAL_CARD_END_6--\u003e的艺术\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e因为每一个查询(Query)都是独立的,D4RT 不需要像穿针引线一样按顺序计算。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它可以一次性扔出几万个问题,利用 GPU/TPU 的并行能力同时算出答案。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这就是为什么它能比别人快 300 倍的根本原因:它把一个复杂的串行几何问题,变成了一个大规模并行的搜索问题。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e关键的「作弊」技巧:\u003c!--VERTICAL_CARD_BEGIN_7--\u003e9x9 Patch\u003c!--VERTICAL_CARD_END_7--\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e论文作者还发现了一个有趣的细节:如果只告诉解码器坐标点,AI 有时候会「脸盲」,分不清纹理相似的区域。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e于是,他们在查询时顺便把那个像素点周围 \u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e9x9\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e的小方块图像(RGB Patch)也喂给了模型。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_38--\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这就像是你让人在人群中找人,光给个坐标不行,还得给他一张那个人脸部的特写照片。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e消融实验证明,这个小小的设计极大地提升了重建的锐度和细节。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection nodeleaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em; line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003c!--IMG_39--\u003e\u003c/section\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 48px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 0px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e产业影响\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e谷歌的野心与具身智能的眼睛\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 的出现,对谷歌现有的业务版图和未来的 AI 战略有着极强的互补性。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e具身智能与自动驾驶的最后一块拼图\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e现在的机器人之所以笨,很大程度上是因为它们「看不懂」动态环境。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e一个扫地机器人能避开沙发,但很难预判一只正在跑过来的猫。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 提供的\u003c/span\u003e\u003c/span\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e实时、密集、动态\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e的 4D 感知,正是机器人急需的技能。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它能让机器人理解:那个东西不仅现在在那里,而且下一秒它会出现在我左边。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e对于自动驾驶而言,这种对动态物体(如行人、车辆)的像素级轨迹预测,是提升安全性的关键。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e增强现实(AR)的基石\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e谷歌一直在 AR 领域寻找突破口(从当年的谷歌眼镜,到现在的 Project Astra)。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e要在眼镜端实现逼真的 AR,必须要有极低延迟的场景理解。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 展示的高效推理能力(尤其是在移动端芯片上的潜力),让「实时把虚拟怪兽藏在真实沙发后面」变得在工程上可行。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px\"\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 8px\"\u003e\u003cstrong style=\"font-size: var(--articleFontsize); letter-spacing: 0.578px\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505100592\" data-ratio=\"0.25\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" data-type=\"png\" data-w=\"292\" src=\"https://inews.gtimg.com/om_bt/ORqmDUGme_4QKR_gUQVeFfcI3cuzkhbNiUnmOSrkTRcqsAA/641\" style=\"height: 20px; width: 81px\" type=\"block\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e对普通人的影响\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-left: 8px; margin-right: 8px\"\u003e\u003cspan style=\"letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e视频编辑的「魔法化」\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e对于普通用户,这项技术最快落地的场景可能是手机相册和视频编辑软件。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e想象一下,你拍了一段孩子踢球的视频。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e有了 D4RT,你可以像在《黑客帝国》里一样,在视频播放过程中随意旋转视角(尽管你拍摄时并没有移动),或者轻易地把路人从复杂的背景中「抠」掉,甚至改变视频中光源的方向。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 48px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e这是 D4RT 这种 4D 重建技术成熟后的应用之一。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003csection style=\"margin-bottom: 0px; margin-top: 0px; text-align: center\"\u003e\u003cspan leaf=\"\"\u003e\u003cimg class=\"rich_pages wxw-img\" data-aistatus=\"1\" data-imgfileid=\"505095291\" data-ratio=\"0.5267857142857143\" data-s=\"300,640\" data-src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" data-type=\"png\" data-w=\"112\" src=\"https://inews.gtimg.com/om_bt/OFraKUfpfSuwUJmpAh2fJ2e6vslwrOx9b8wpZ1WfoiZRoAA/641\" style=\"height: 40px; width: 85px\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003cimg data-src=\"\" style=\"\" data-aigc-mark=\"0\"/\u003e\u003c/span\u003e\u003c/section\u003e\u003csection style=\"line-height: 1.75em; margin-bottom: 24px; margin-top: 8px; text-align: center\"\u003e\u003cspan style=\"color: rgb(0, 0, 0); font-size: 19px; letter-spacing: 1px\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\"\u003e结语\u003c/span\u003e\u003c/strong\u003e\u003c/span\u003e\u003c/section\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eD4RT 让我们看到了一种新的可能性:AI 对世界的理解,正在从二维的「图像识别」跨越到四维的「时空洞察」。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e它告诉我们,要看清这个流动的世界,关键不在于每一帧都看得多仔细,而在于如何建立一个能够随时回应疑问的全局记忆。\u003c/span\u003e\u003c/span\u003e\u003c/p\u003e\u003cp style=\"line-height: 1.75em; margin: 0px 8px 24px; text-align: justify\"\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e在 \u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003eAI\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003cstrong\u003e\u003cspan leaf=\"\" style=\"color: rgba(0, 0, 0, 0.9); font-size: 17px; font-style: normal; font-weight: normal; letter-spacing: 0.034em\"\u003e\u003cspan style=\"font-size: 15px; letter-spacing: 1px\" textstyle=\"\"\u003e的眼中,过去并没有消逝,未来也不再不可捉摸,它们只是同一个四维坐标系里,等待被查询的两个不同参数而已。\u003c/span\u003e\u003c/span\u003e\u003c/strong\u003e\u003c/p\u003e\u003csection data-pm-slice=\"3 2 []\" style=\"background-color: rgb(255, 255, 255); letter-spacing: 0.544px; line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px; min-height: 1em; text-align: left\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 14px; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003e参考资料:\u003c/span\u003e\u003cspan leaf=\"\"\u003e\u003cbr/\u003e\u003c/span\u003e\u003c/span\u003e\u003c/section\u003e\u003csection data-pm-slice=\"3 2 []\" style=\"background-color: rgb(255, 255, 255); letter-spacing: 0.544px; line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px; min-height: 1em; text-align: left\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 14px; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003ehttps://d4rt-paper.github.io/\u003c/span\u003e\u003c/span\u003e\u003c/section\u003e\u003csection data-pm-slice=\"3 2 []\" style=\"background-color: rgb(255, 255, 255); letter-spacing: 0.544px; line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px; min-height: 1em; text-align: left\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 14px; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003ehttps://deepmind.google/blog/d4rt-teaching-ai-to-see-the-world-in-four-dimensions/\u003c/span\u003e\u003c/span\u003e\u003c/section\u003e\u003csection data-pm-slice=\"3 2 []\" style=\"background-color: rgb(255, 255, 255); letter-spacing: 0.544px; line-height: 1.75em; margin-bottom: 0px; margin-left: 8px; margin-right: 8px; min-height: 1em; text-align: left\"\u003e\u003cspan style=\"color: rgb(136, 136, 136); font-size: 14px; letter-spacing: 1px\"\u003e\u003cspan leaf=\"\"\u003ehttps://storage.googleapis.com/d4rt_assets/D4RT_paper.pdf\u003c/span\u003e\u003c/span\u003e\u003c/section\u003e\u003c/div\u003e