ChatGPT AI搜索還不是“谷歌殺手”:關鍵字搜索不靠譜

11月5日消息,OpenAI上週正式發佈了備受矚目的搜索產品ChatGPT Search,向谷歌發起了直接挑戰。這一時刻的到來,其實早已在業界的預料之中,因此谷歌在今年早些時候便將人工智能生成的答案融入其核心產品之中,但在此過程中卻出現了一些令人尷尬的“幻覺”。這個失誤讓不少人認爲,OpenAI的搜索引擎將會成爲真正的“谷歌殺手”。

然而,在將ChatGPT Search作爲默認搜索引擎使用了一天左右後,科技記者麥克斯韋爾·澤夫(Maxwell Zeff)便迅速切換回了谷歌。儘管OpenAI的搜索產品在某些方面確實令人印象深刻,讓我們得以窺見未來人工智能搜索界面的模樣,但就現階段而言,它仍然略顯理想化,並不適合作爲日常搜索工具來使用。

ChatGPT Search在某些時候確實能夠高效地提供實時問題的答案,避免了翻閱廣告和SEO優化文章的煩惱。最終,它還會以一種清晰明瞭的格式給出簡潔的答案,並在右側附上信息來源的鏈接、標題及簡短介紹,以便我們確認所閱讀的人工智能生成文本是否準確無誤。

然而,對於日常搜索需求而言,ChatGPT Search卻常常給人一種不切實際的感覺。

在當前形式下,ChatGPT Search在處理人們日常使用谷歌最多的簡短查詢時顯得不夠可靠。這類查詢通常不超過四個單詞,卻佔據了谷歌搜索的大部分;通常是幾個關鍵詞,用於快速找到所需網頁。許多人可能並未意識到,自己整天都在進行這樣的搜索,而谷歌在這方面的表現一直相當出色。

例如,查詢“NBA凱爾特人隊的比分”、“棉襪”、“圖書館的營業時間”、“舊金山的天氣”、“我附近的咖啡館”等,這類查詢使谷歌成爲數十億人進入互聯網的首選入口。

澤夫在使用ChatGPT Search進行測試時經常感到沮喪,這讓他意識到自己每天進行大量關鍵字搜索。他無法通過簡短的查詢在ChatGPT Search上穩定地找到所需信息。多年來第一次,澤夫真切地渴望重新使用谷歌搜索。

當然,這並不是說谷歌的搜索質量在過去十年裡沒有下降,事實上,由於廣告和搜索引擎優化的影響,其搜索質量確實有所下滑。但在測試過程中,澤夫在測試過程中不得不始終在另一個窗口中保持谷歌打開狀態,因爲ChatGPT Search往往無法爲他提供正確的答案或網頁鏈接。

誰會贏:ChatGPT Search還是簡短查詢?

澤夫嘗試通過輸入“掘金比分”來查看丹佛掘金隊與明尼蘇達森林狼隊的NBA比賽實時情況。然而,ChatGPT回答掘金隊在贏球,但事實上他們正在輸球。更糟糕的是,根據谷歌的結果,ChatGPT顯示的森林狼隊得分比實際得分整整低了10分。

另一次,澤夫輸入“今日收益”來查詢可能影響週五股價的公司季度財報信息。ChatGPT告訴他,蘋果和亞馬遜將在週五公佈財報,而事實上,這兩家公司的財報早在一天前就已經發布了。簡而言之,ChatGPT出現了“幻覺”,提供了錯誤的信息。

在另一次測試中,澤夫輸入了一位科技公司高管的名字,希望能找到他的聯繫方式。ChatGPT不僅向他展示了這位高管的Facebook個人資料摘要,還“編造”出了一個指向其LinkedIn頁面的鏈接。但當澤夫點擊這個鏈接時,卻收到了一個錯誤信息。

還有一次,澤夫輸入“寬鬆的牛仔褲”,希望能找到購買渠道。ChatGPT Search首先向他解釋了什麼是寬鬆的牛仔褲(儘管這個定義對於大多數人來說可能是多餘的),然後建議他去亞馬遜網站購買一條不錯的牛仔褲。

這樣的例子還有很多,但相信你已經明白了。在使用ChatGPT Search的第一天,澤夫就遭遇了許多無效鏈接、信息“幻覺”以及隨機的答案。

也許將來會成爲“谷歌殺手”,但不是今天

對於OpenAI而言,ChatGPT Search的發佈具有里程碑式的意義。該公司首席執行官薩姆·奧特曼(Sam Altman)雖然常常低調評價自家創業公司的人工智能能力,但他仍對ChatGPT Search讚譽有加,稱其“真的很好”。這次之所以不同,或許是因爲搜索業務作爲互聯網上最大的業務之一,其重要性不言而喻,而OpenAI的搜索功能確實有可能對其最大競爭對手谷歌構成實質性的威脅。

客觀地說,谷歌搜索是一個已有25年曆史的產品,而ChatGPT Search則完全是一個新生事物。OpenAI在一篇博客文章中表示,他們計劃在未來幾個月內根據用戶反饋不斷對這一功能進行改進,這無疑將是這家初創公司重點投資的一個關鍵領域。

可以肯定,ChatGPT Search在回答複雜冗長的研究性問題方面表現得相當出色。例如,對於“哪個美國職業體育聯盟最具多樣性?”這樣的問題,谷歌可能難以迅速給出滿意的答案,但ChatGPT Search卻能夠迅速整合多個網站的信息,在幾秒鐘內爲你提供相當完整的答案。同樣,已經問世一年多的Perplexity搜索產品在這類問題上也有不俗的表現。

與傳統版本的ChatGPT相比,ChatGPT Search已經具備了網頁訪問功能,它爲用戶提供了一個更加出色的網頁瀏覽界面。現在,ChatGPT在獲取信息時,會提供更加清晰的鏈接來源——對於新聞報道,ChatGPT將與已經達成所有許可協議的主要新聞媒體公司進行合作。

然而,大多數谷歌搜索查詢並不如此冗長。爲了真正取代谷歌,OpenAI需要改進ChatGPT Search在更實用、更簡短的日常搜索中的表現。

對此,OpenAI並不迴避承認ChatGPT Search在短查詢中的不足。該公司發言人尼科·費利克斯(Niko Felix)對此表示:“通過ChatGPT Search,我們觀察到用戶更傾向於以更自然、更口語化的方式提出問題,這與他們過去使用其他搜索工具的習慣有所不同。同時,我們也注意到,那些簡短的網頁導航查詢——通常只有幾個字——同樣非常普遍。我們計劃在未來不斷優化,以改善這類查詢的用戶體驗。”

換言之,這些簡短的關鍵字查詢正是谷歌長期以來不可或缺的優勢所在,而在OpenAI能夠完美解決這類查詢之前,谷歌仍將是許多人的首選搜索工具。

OpenAI在處理這些簡短查詢時可能面臨更多挑戰,原因主要有以下幾點:首先,ChatGPT在技術上依賴於微軟的必應搜索引擎,而微軟必應在業界普遍被認爲其搜索質量不及谷歌。其次,大型語言模型可能並不太擅長處理這些簡短的輸入。這類模型通常需要接收完整的書面提示,才能產生有效的答案。或許,我們需要通過某種方式重新引導用戶——在ChatGPT Search能夠出色完成這類搜索之前,利用大語言模型將簡短查詢轉換爲更詳細的問題。

值得一提的是,儘管OpenAI的搜索產品剛剛發佈,但另一家人工智能搜索工具Perplexity每週已經能夠處理1億個搜索查詢。Perplexity也曾被標榜爲“谷歌殺手”,但它在處理簡短查詢時也遇到了同樣的問題。

Perplexity的首席執行官阿拉文德·斯里尼瓦斯(Aravind Srinivas)曾就人們使用其產品與谷歌搜索的不同之處進行過探討。他說:“谷歌搜索的平均查詢字數通常在2到3個之間,而在Perplexity中,平均查詢字數則達到了10到11個。這表明,在Perplexity上,人們更傾向於直接提出問題。相比之下,在谷歌上,用戶只需輸入幾個關鍵詞,就能迅速跳轉到相關的鏈接。”

澤夫認爲,人們並不使用這些新產品進行網頁導航的事實,實際上揭示了比OpenAI或Perplexity所公開承認的更爲嚴重的問題。這意味着,ChatGPT Search和Perplexity並未能取代谷歌搜索在網頁導航方面的核心優勢。相反,這些人工智能產品正在開拓一個新的細分市場,揭示和呈現傳統搜索中那些被忽視或隱藏的信息。當然,這本身就是一個極具價值的領域。

OpenAI和Perplexity都表示,他們有信心在未來改進這些簡短查詢的處理能力。但在此之前,澤夫認爲這兩款產品都無法完全取代谷歌的地位。如果OpenAI真的想要成爲通往互聯網的新大門,那麼它就必須創造出一個比現有大門更加出色、更加便捷的新入口。(小小)