上萬(wàn)照片秒搜?百度網(wǎng)盤搞了個(gè)AI高級(jí)圖搜功能
壓箱底的照片都給你搜出來(lái),何嘗不是一個(gè)“噩耗”。
國(guó)內(nèi)大模型,從年初開始卷現(xiàn)在,都開始追求賦能應(yīng)用了。百度李彥宏在公開場(chǎng)合不止一次提到,要把百度的產(chǎn)品用AI“從頭到尾重做一遍”。
但誰(shuí)能想到,百度系率先把AI玩出花來(lái)的竟然是百度網(wǎng)盤。
就在最近,為了讓你更容易找到你想要的照片、視頻,百度網(wǎng)盤費(fèi)盡心機(jī)上線了一個(gè)名叫“高級(jí)圖片搜索”的功能,官方號(hào)稱上萬(wàn)照片能夠秒搜索,秒響應(yīng)。各路網(wǎng)友紛紛表示好奇。
“高級(jí)圖片搜索”,能有多高級(jí)?
百度網(wǎng)盤其實(shí)一直都有圖片搜索的功能,但是和一眾搜圖功能一樣,一旦你關(guān)鍵詞輸?shù)牟粚?duì),網(wǎng)盤就開始“犯傻”,提示沒(méi)找到結(jié)果。
現(xiàn)在推出的這套“高級(jí)圖搜”功能,據(jù)說(shuō)是在原有搜圖功能上基于AI延伸而來(lái)的。
官方介紹,百度網(wǎng)盤現(xiàn)在能夠通過(guò)基于向量的語(yǔ)義搜索,理解涵蓋時(shí)間、地點(diǎn)、人物、事件等多個(gè)要素的組合搜索語(yǔ)句,從而提供更準(zhǔn)確、更全面的搜索結(jié)果。這項(xiàng)功能能夠幫助用戶快速找到上萬(wàn)張照片和視頻。
目前大部分用戶都可以體驗(yàn)這個(gè)功能。先在網(wǎng)盤搜索“高級(jí)圖片搜索”,點(diǎn)擊結(jié)果進(jìn)入介紹頁(yè)面,在最底部點(diǎn)擊“立即體驗(yàn)”并坐等數(shù)據(jù)升級(jí)完成,即可體驗(yàn)新功能了。
其實(shí)不光是圖片,這個(gè)功能也可以搜索視頻。輸入的詞匯可以是單個(gè)詞,也可以是一句話。而且隨著描述的細(xì)節(jié)越多,搜索結(jié)果也可以實(shí)時(shí)調(diào)整。
這個(gè)功能,可能百度的產(chǎn)品團(tuán)隊(duì)預(yù)想的是讓人們來(lái)搜索一些值得懷念的照片。但實(shí)際上,熱衷于“挖墳”的當(dāng)代人全都在用它找“表情包”。更有的,是找朋友、同事的“黑歷史”。
一個(gè)正經(jīng)功能,再次被多才多藝的人類玩壞了。所以說(shuō),AI不學(xué)壞是沒(méi)辦法打敗人類的。
AI圖搜背后的大模型
據(jù)了解,此次上線的高級(jí)圖搜功能的背后,是百度的文心大模型。目前大多數(shù)圖片搜索依賴的都是“標(biāo)簽功能”,但實(shí)際上“標(biāo)簽”沒(méi)辦法將文字和圖片精準(zhǔn)得聯(lián)系起來(lái),所以在搜索時(shí)經(jīng)常遇到“搜了個(gè)寂寞”。
為了解決這一問(wèn)題,百度網(wǎng)盤的團(tuán)隊(duì)選用了百度文心的多模態(tài)大模型VIMER-ViLP,并用海量圖片和文本數(shù)據(jù)對(duì)它進(jìn)行了訓(xùn)練,來(lái)實(shí)現(xiàn)“基于向量的語(yǔ)義搜索”。
而所謂的“基于向量的語(yǔ)義搜索”,指的是網(wǎng)盤中的所有照片會(huì)被編碼為一組特征向量。在搜索時(shí),你輸入的文本信息也會(huì)被轉(zhuǎn)換為一組特征向量。
而圖片向量和文本向量之間的距離越近,圖片和文本的相似度就越高,該圖片就越可能是你想找的那張。
在這種機(jī)制下,你不用絞盡腦汁去想什么“標(biāo)簽”。想輸什么就輸什么,反正也會(huì)被轉(zhuǎn)化成文本向量。這樣一來(lái),才會(huì)有更準(zhǔn)確的搜索結(jié)果。
但是“標(biāo)簽”也不是毫無(wú)用處。面對(duì)時(shí)間和地點(diǎn)這種信息,大模型也無(wú)法理解,還需要“標(biāo)簽”來(lái)補(bǔ)充。開發(fā)團(tuán)隊(duì)利用AI,將文本信息和照片的數(shù)據(jù)信息進(jìn)行對(duì)比,結(jié)合上面的向量分析形成組合搜索,才讓這個(gè)功能真正實(shí)現(xiàn)。
光搜得準(zhǔn)沒(méi)用,還得搜得快。為了提高搜索速度,百度網(wǎng)盤還采用了異構(gòu)算力調(diào)度系統(tǒng),充分利用云上算力,降低了本地索引占用空間的同時(shí),提供了更精確的查找能力。
此外,百度網(wǎng)盤還支持OCR識(shí)圖和以圖搜圖功能,能夠自動(dòng)關(guān)聯(lián)百度百科信息和全網(wǎng)信息。
百度網(wǎng)盤身上的AI“大雜燴”
其實(shí)這個(gè)“高級(jí)圖搜”功能,不是度盤上線的第一個(gè)AI功能了。
5月份,在萬(wàn)象百度移動(dòng)生態(tài)大會(huì)上,百度網(wǎng)盤宣布推出基于文心大模型的“云一朵”智能助理。然后5月27日,百度網(wǎng)盤宣布“云一朵”智能助理開啟內(nèi)測(cè)。
據(jù)百度的介紹,“云一朵”可通過(guò)自然對(duì)話幫助用戶在海量信息中快速查找信息。只要有了“云一朵”,找圖、摘要、翻譯等能力,都是一句話的事兒。
可以看出來(lái),百度推出文心大模型之后,真的打算把所有產(chǎn)品用大模型重新“改造”一遍。而百度網(wǎng)盤作為百度用戶最多的產(chǎn)品之一,自然是改造的第一梯隊(duì)。
但是人們可能更關(guān)心的是,這樣一來(lái)自己存在網(wǎng)盤里的那些“秘密”不是更容易被發(fā)現(xiàn)了嗎?還有,你這些功能這么厲害,是不是代表網(wǎng)盤會(huì)員要漲價(jià)?!
不愧是你啊,百度!

發(fā)表評(píng)論
請(qǐng)輸入評(píng)論內(nèi)容...
請(qǐng)輸入評(píng)論/評(píng)論長(zhǎng)度6~500個(gè)字
最新活動(dòng)更多
-
3月27日立即報(bào)名>> 【工程師系列】汽車電子技術(shù)在線大會(huì)
-
4月30日立即下載>> 【村田汽車】汽車E/E架構(gòu)革新中,新智能座艙挑戰(zhàn)的解決方案
-
5月15-17日立即預(yù)約>> 【線下巡回】2025年STM32峰會(huì)
-
即日-5.15立即報(bào)名>>> 【在線會(huì)議】安森美Hyperlux™ ID系列引領(lǐng)iToF技術(shù)革新
-
5月15日立即下載>> 【白皮書】精確和高效地表征3000V/20A功率器件應(yīng)用指南
-
5月16日立即參評(píng) >> 【評(píng)選啟動(dòng)】維科杯·OFweek 2025(第十屆)人工智能行業(yè)年度評(píng)選
推薦專題
-
10 月之暗面,絕地反擊
- 1 UALink規(guī)范發(fā)布:挑戰(zhàn)英偉達(dá)AI統(tǒng)治的開始
- 2 北電數(shù)智主辦酒仙橋論壇,探索AI產(chǎn)業(yè)發(fā)展新路徑
- 3 “AI寒武紀(jì)”爆發(fā)至今,五類新物種登上歷史舞臺(tái)
- 4 降薪、加班、裁員三重暴擊,“AI四小龍”已折戟兩家
- 5 國(guó)產(chǎn)智駕迎戰(zhàn)特斯拉FSD,AI含量差幾何?
- 6 光計(jì)算迎來(lái)商業(yè)化突破,但落地仍需時(shí)間
- 7 東陽(yáng)光:2024年扭虧、一季度凈利大增,液冷疊加具身智能打開成長(zhǎng)空間
- 8 地平線自動(dòng)駕駛方案解讀
- 9 封殺AI“照騙”,“淘寶們”終于不忍了?
- 10 優(yōu)必選:營(yíng)收大增主靠小件,虧損繼續(xù)又逢關(guān)稅,能否乘機(jī)器人東風(fēng)翻身?