極客號(hào)(Daydx.com)7月11日 消息:李飛飛團(tuán)隊(duì)的最新成果是一項(xiàng)名為 VoxPoser 的具身智能技術(shù),可以使機(jī)器人直接聽(tīng)懂人類(lèi)的自然語(yǔ)言指令并完成復(fù)雜任務(wù),無(wú)需額外的數(shù)據(jù)和訓(xùn)練。
這項(xiàng)技術(shù)通過(guò)將大語(yǔ)言模型和視覺(jué)語(yǔ)言模型結(jié)合,從3D 空間中分析目標(biāo)和障礙物,幫助機(jī)器人進(jìn)行行動(dòng)規(guī)劃。該方法實(shí)現(xiàn)了零樣本能力,即機(jī)器人可以在未經(jīng)過(guò)訓(xùn)練的情況下直接執(zhí)行任務(wù)。
此外,該技術(shù)還具有涌現(xiàn)能力,能夠評(píng)估物理特性、進(jìn)行行為常識(shí)推理、進(jìn)行細(xì)粒度校正和實(shí)現(xiàn)基于視覺(jué)的多步操作。研究人員將該技術(shù)稱(chēng)為計(jì)算機(jī)視覺(jué)的一顆北極星,為具身智能領(lǐng)域開(kāi)辟了新世界。該研究成果引起了學(xué)術(shù)界的廣泛興趣,并改變了一些人對(duì)于人工智能的看法。