大模型加持,搜索會更好用?
想從浩如煙海的互聯(lián)網(wǎng)上找到自己所需的信息,對于現(xiàn)在的人而言,不是更簡單,而是更難了。
2020年,全球數(shù)據(jù)總量達到了驚人的51 ZB(即51萬億GB),數(shù)字還在不斷增長,據(jù)預(yù)測在2025年將達到175 ZB到180 ZB之間。
驚人的數(shù)據(jù)量與豐富的載體,都讓找信息變成一件更難的事情。傳統(tǒng)搜索引擎在滿足用戶信息獲取需求上,顯得越來越力不從心。
在傳統(tǒng)搜索引擎瓶頸盡顯時,大模型的出現(xiàn)帶來了全新可能。
繼4月17日發(fā)布天工通用大語言模型后,8月23日,昆侖萬維正式推出國內(nèi)第一款融入大語言模型的搜索引擎——天工AI搜索,并開啟內(nèi)測申請(內(nèi)測地址:tiangong.cn)。
昆侖萬維為天工AI搜索寫下了如下時代注腳:“我們認(rèn)為傳統(tǒng)搜索已到了奇點時刻,陳舊的體驗需要被顛覆、被改變?!?/span>
被阻塞的最后一公里
搜索是互聯(lián)網(wǎng)時代人們最基礎(chǔ)的需求。
由于互聯(lián)網(wǎng)信息快速生產(chǎn)、繁殖的特性,搜索天然充當(dāng)著用戶觸達數(shù)字化信息和服務(wù)的基礎(chǔ)路徑。因此,早在互聯(lián)網(wǎng)誕生之前,第一代搜索引擎的鼻祖就已經(jīng)在加拿大誕生。
表面上看,搜索只是為了解決某個問題,而實際上,每一個搜索請求背后都蘊藏著更為現(xiàn)實而具體的需求。一旦搜索能夠更加準(zhǔn)確、個性化的應(yīng)答需求,相當(dāng)于為用戶打造了一個全知全能的超級入口。
然而,傳統(tǒng)搜索引擎的典型使用場景是,用戶鍵入若干關(guān)鍵詞、瀏覽眾多網(wǎng)頁、自行摘取信息點、再把點連成線,才能最終得到想要的答案。
這是因為傳統(tǒng)搜索依賴于關(guān)鍵詞匹配,不具備綜合分析和細致對話的能力,難以理解用戶的真正意圖,也就很難為用戶提供深度和上下文相關(guān)的答案。
搜索引擎本是人類在數(shù)字化世界的導(dǎo)航和地圖,如今地圖過時了,人類需要盡快脫離信息的泥沼。
技術(shù)范式的突破為解決問題帶來新的可能。
今年2月,微軟宣布基于ChatGPT推出全新搜索引擎的Bing和Edge瀏覽器,5月,微軟徹底打通Bing和ChatGPT之間的生態(tài)壁壘。被逼急了的谷歌很快在6月推出試驗版AI搜索引擎Search Generative Experience防御。
資深巨頭們再度下場貼身肉搏,帶來的不僅是充滿硝煙味兒的熱鬧,更探索出未來的方向——是的,顛覆了AI技術(shù)原有范式的大模型,不約而同成為行業(yè)顛覆傳統(tǒng)搜索引擎的突破口。
大模型雖強悍,但也存在“一本正經(jīng)的胡說八道”的短板。如果能將搜索的實時性和大模型的智能性結(jié)合起來,人類將獲得迄今為止最趁手的“沖浪”工具。
國外的科技巨頭刺刀見紅、不斷探索之時,國內(nèi)的科技公司們也沒閑著。
作為國內(nèi)第一款應(yīng)用級的落地產(chǎn)品,天工AI搜索為安定了多年的搜索行業(yè)扔下一顆重磅炸彈。這顆炸彈不僅想要打通信息高速公路與用戶之間梗阻的最后一公里,更為大模型在C端的真正落地,辟出了一條路。
四個維度,全面升級
有了大模型的加持,搜索究竟會有什么改變?百聞不如一見,先來感受下我們的測試體驗。
測試先從一個寬泛的問題開始,輸入“新加坡好玩嗎”之后,天工AI搜索開始整活:列出幾個相關(guān)鏈接,提供了信息溯源,隨后給出了一段完整的回答。
與傳統(tǒng)搜索引擎根據(jù)關(guān)鍵詞識別檢索范圍匹配海量信息不同,基于大模型能力的AI搜索是一種生成式搜索,用戶可通過自然語言清晰表達自己的意圖,并獲得有效組織和提煉后的答案,不用再一個個點鏈接、看網(wǎng)頁,為冗余信息浪費時間。
因為天工AI搜索確實能“聽懂”用戶在說什么、用戶想要什么,所以能給出完整而非碎片式信息的答案。用戶不再需要通過關(guān)鍵詞來適應(yīng)搜索引擎的工作方式,而是自然語言式交互讓搜索引擎以人性化方式來適應(yīng)人類。
從尋找內(nèi)容,到獲取答案,天工AI搜索的革新性可見一斑。
突破了傳統(tǒng)搜索引擎短板的局限外,天工AI搜索也補上了大模型的短板。
傳統(tǒng)搜索的痛點之一,在于不同來源的海量信息帶來的大量冗余和信息不一致;與此同時,大語言模型的生成機制,也無法完全規(guī)避“一本正經(jīng)地胡說八道”現(xiàn)象。天工AI搜索在所有回答中加入了信源索引,以此保障答案可追溯、可考證、可信賴。同時,用戶可將每輪次的搜索結(jié)果留存在天工內(nèi),便于隨時查閱回溯,也可一鍵分享給他人。
上圖“新加坡好玩嗎”的答案中,天工AI搜索便列出了6個信息溯源點,給出的完整回答中,每一個信息點都關(guān)聯(lián)到了相應(yīng)的信息溯源點,確保了信息的真實、準(zhǔn)確和有效。天工AI搜索的雙重技術(shù)保障,讓魚龍混雜的信息變得可追溯可信賴。
一個簡單測試,已經(jīng)能夠看出天工AI搜索的智能升維。為了進一步測試天工AI搜索的智能程度,我們進行了追問,加了一個限定條件“三天時間”,希望得到旅行建議。
天工AI搜索很快給出了相應(yīng)的游玩安排,沒有機械羅列景點,而是為每天定下相應(yīng)主題,并安排上相關(guān)的游覽路線。其中第二天行程主題是感受本地生活,非常貼近時下流行的city walk,已經(jīng)是一份十分可行且非常個性化的旅行攻略了。
測試到這還沒結(jié)束,我們進行了第二次追問,加上了“親子友好”的限定條件。在這次追問中,我們并沒有明確這個攻略要覆蓋幾天的行程,但天工AI搜索根據(jù)上下文的信息給出的是三天的行程攻略,顧及到了親子友好的需求。不得不說,天工AI搜索是真的很“懂”。
從這個連環(huán)追問的表現(xiàn)來看,天工AI搜索對大模型技術(shù)的應(yīng)用,使意圖識別成為可能,用戶完全可以通過自然流暢的對話式交互來清晰表達自己的意圖,從而獲得精準(zhǔn)、有效且個性化的答案。用戶可以在搜索上獲得“量身定做”和“千人千面”式體驗,搜索從模糊走向精確,從通用走向了個性。
上面測試的搜索需求比較生活化,為了了解天工AI搜索在專業(yè)領(lǐng)域的表現(xiàn),我們又測試了一個更加專業(yè)的問題。
在輸入了“目前電動汽車的電池有哪些技術(shù)流派”后,天工AI搜索依舊列出了6個信息溯源點,給出了經(jīng)過總結(jié)和提煉的答案。這個回答不僅歸納了當(dāng)前電池的主要類別,還介紹了市場主流的電池類型,以及更加前沿的電池技術(shù)。短短一段話,足以讓用戶對電池行業(yè)的現(xiàn)狀有大致了解。
并且,天工AI搜索列出的推薦追問方向十分具體和專業(yè)。
當(dāng)然,既然是測試必須要加大難度,所以我們追問的是“前沿電池技術(shù)哪個最有優(yōu)勢”,這是一個非??简濧I搜索理解、總結(jié)信息能力的問題。而天工AI搜索沒有被難倒——沒有一本正經(jīng)的胡說八道,天工給出了明確的回答,和充足的論據(jù),每一個論點都有據(jù)可依。
這個測試將AI搜索“可以根據(jù)上下文語義與用戶展開多輪次、深度的對話,從而實現(xiàn)對于復(fù)雜問題的深入研究的能力”,展現(xiàn)得淋漓盡致。
據(jù)介紹,天工AI搜索的“追問”功能讓用戶可以就一個問題展開20輪次以上交互,以此展開深度探索。
此外,大模型使得AI搜索具備了整合、提煉、串聯(lián)信息的能力,因此AI搜索能更好地應(yīng)對開放式問題,在處理知識類以及創(chuàng)意類搜索時,其體驗與效率將遠勝于傳統(tǒng)搜索引擎。
基于人類反饋強化學(xué)習(xí)(RLHF)進行訓(xùn)練的大語言模型,更進一步提升了AI搜索的答案對于人的價值。
這些都使得天工AI搜索實現(xiàn)了從信息到知識的躍升。
從尋找內(nèi)容到獲取答案;從魚龍混珠到可追溯和信賴;從模糊到精確,從通用到個性;從信息到知識,與傳統(tǒng)搜索引擎相比,天工AI搜索的升級是全方位的,可以說是升維打擊。它是如何做到的?
1+1的化學(xué)反應(yīng)
天工AI搜索跨越式進化的秘密,在于技術(shù)范式的突破。跳脫出了傳統(tǒng)搜索引擎的技術(shù)路徑,天工AI搜索采用了全新的技術(shù)框架。
與傳統(tǒng)搜索引擎相比,天工AI搜索為用戶省去了瀏覽、摘取、整理信息的過程,能直接給出完整的回答。相較大模型,天工AI搜索又可以實時獲取互聯(lián)網(wǎng)信息,能夠利用最新的互聯(lián)網(wǎng)信息回答需要實時信息的問題。
而且,天工AI搜索將支持多模態(tài)搜索,除了文字,AI搜索還支持圖像、語音等多種輸入方式,允許用戶通過各種方式搜索信息。據(jù)了解,圖片搜索會在多模態(tài)大模型下一個版本中上線。在全新的技術(shù)框架下,不同載體的信息都可以被天工AI搜索連接、理解并呈現(xiàn)。
用戶終于不再需要在海量網(wǎng)頁中辛苦的尋找答案了,天工AI搜索能為用戶提供更高效、更個性化、交互更簡單的搜索服務(wù),人類在數(shù)字世界的信息迷宮里,終于有了一個全自動導(dǎo)航。
得以如此智能,離不開大模型技術(shù)的加持。同時,原有的搜索引擎技術(shù)還能修正大模型現(xiàn)有的不足。通過將大模型和搜索引擎結(jié)合,天工AI搜索既解決了大模型胡編亂造的問題,又能夠分析用戶的真實意圖,具備比傳統(tǒng)的搜索引擎更強的理解能力。
也就是說,大模型的智能與搜索引擎的及時被合二為一,天工AI搜索將人找信息的模式,切換到了“信息找人”的模式。
不再性感的搜索引擎被大模型注入了新想象,而搜索引擎也補足了大模型的短板,新舊技術(shù)范式產(chǎn)生的化學(xué)反應(yīng),造就了“天工”,也探出了大模型的下凡路。
以搜索這種用戶最為習(xí)慣的應(yīng)用形態(tài)為媒介,昆侖萬維為大模型嵌入更多人的日常,鋪平了道路。與搜索本身的迭代相比,這是更為重要的價值。
搜索引擎走出搜索
人機對話早已不是新奇玩意,AI賦能搜索也并不是新鮮話題,評估天工AI搜索的價值,既要看其技術(shù)框架,也要看其未來空間。
大模型是天工AI搜索實現(xiàn)跨代際搜索體驗的功臣。有了大模型的助力,天工AI搜索才能真正“懂”了。
作為天工AI搜索背后的功臣,天工大模型本身就是一個狠角色。
天工大模型采用了雙千億級大語言模型,具備了更高級的自主學(xué)習(xí)和智能涌現(xiàn)能力。天工大模型背后還有國內(nèi)最大的GPU集群之一,能夠進行充分訓(xùn)練。
在此基礎(chǔ)上,天工采用了蒙特卡洛搜索樹算法進行優(yōu)化,這進一步提高了解碼過程中的準(zhǔn)確性和安全性,這是天工在復(fù)雜任務(wù)和場景中能夠快速且準(zhǔn)確響應(yīng)指令,讓用戶感受到其足夠“聰明”、“通人性”的關(guān)鍵原因之一。
為了給天工最優(yōu)質(zhì)的燃料,天工團隊投入大量資源從數(shù)十萬億的數(shù)據(jù)中清洗、篩選出了3萬億單詞數(shù)據(jù)用于訓(xùn)練大模型。這使得天工天然“更懂中文”。
有了大模型的助力,“天工AI搜索”塑造“搜索鏈接一切”的邊界能力,從人和服務(wù)拓展到任意需求和答案。真正做到了信息孤島時代,降低搜索難度,實現(xiàn)知識遷移,對信息重新組織、整理、進行輸出,最大程度降低時間成本,獲取高質(zhì)量信息,提高決策效率。這蘊藏著解碼天工價值空間的關(guān)鍵線索。
無論技術(shù)如何進化,搜索本質(zhì)上是一個工具,如果工具的能力更加豐富,自然會深入嵌入用戶的日常生活。
現(xiàn)在,天工AI搜索將搜索引擎升級為解決方案輸出者,搜索的邊界和價值也迎來了重估時刻——無論是材料收集、文案撰寫、科研學(xué)習(xí)、智力外腦,乃至為生活提供全天候服務(wù)的生活管家,小小的搜索框?qū)⒊蔀橛脩舻纳a(chǎn)力助手。
可以推測,伴隨AI搜索的智能化程度持續(xù)提升,天工AI搜索必將集聚更多用戶和開發(fā)者,催生更為豐富立體的應(yīng)用場景和產(chǎn)品。
比如,當(dāng)用戶搜索“孕晚期血糖偏高晚餐適合吃什么”時,天工AI搜索不僅能給出具體的建議,還能給出相關(guān)食品的購買鏈接,輸出一體化解決方案。
當(dāng)需求都可以通過一個搜索框解決,AI搜索作為大模型時代的應(yīng)用端基礎(chǔ)設(shè)施和超級流量入口的潛力也隨之浮現(xiàn)。
盡管以搜索框的形態(tài)出現(xiàn),很容易被人歸類到工具中,但體驗過之后就會明白,AI搜索是全然不同于傳統(tǒng)搜索引擎的新物種,其具備成為AI時代超級入口的誘人前景。當(dāng)前,天工AI搜索“小荷才露尖尖角”,但作為率先掌握并推出了AI搜索的玩家,天工已經(jīng)為自己打開了全新的價值空間。
技術(shù)的進步從來不是一蹴而就,但關(guān)鍵的變化往往只取決于幾個瞬間。天工AI搜索已經(jīng)扇動了蝴蝶的翅膀,更大的風(fēng)暴已在醞釀。
本文僅代表作者觀點,版權(quán)歸原創(chuàng)者所有,如需轉(zhuǎn)載請在文中注明來源及作者名字。
免責(zé)聲明:本文系轉(zhuǎn)載編輯文章,僅作分享之用。如分享內(nèi)容、圖片侵犯到您的版權(quán)或非授權(quán)發(fā)布,請及時與我們聯(lián)系進行審核處理或刪除,您可以發(fā)送材料至郵箱:service@tojoy.com





