AI無疑成為了今年谷歌的I/O開發(fā)者大會上絕對主角,與普羅大眾息息相關(guān)的,則是谷歌將生成式AI引入搜索引擎,用AI重新塑造包括搜索引擎在內(nèi)的所有核心產(chǎn)品,谷歌的這一策略顯然讓資本市場很滿意,因此也使得其母公司Alphabet的股價創(chuàng)下了逾8個月來的新高。然而谷歌雖然是開心了,但有人卻不干了,其中網(wǎng)絡(luò)出版商就表現(xiàn)出了擔(dān)憂的態(tài)度,擔(dān)心谷歌搜索可能會影響到他們網(wǎng)站的流量。
根據(jù)海外用戶的測試顯示,在谷歌搜索中AI生成的內(nèi)容會顯示在自然搜索結(jié)果上,而且不會完整顯示被索引的網(wǎng)站。以至于有相關(guān)網(wǎng)站方面表示,谷歌的這一舉動根本就沒有考慮到網(wǎng)絡(luò)出版商的利益,谷歌的AI搜索就相當(dāng)于是在剽竊網(wǎng)站內(nèi)容。要知道,過去數(shù)年間出版商與谷歌之間的關(guān)系已經(jīng)極為緊張,雙方圍繞“內(nèi)容支付公平”的斗爭從新大陸打到舊大陸、從北半球打到了南半球,雙方圍繞內(nèi)容產(chǎn)生的收益分配早已可謂是“刺刀見紅”。
這一輪斗爭的結(jié)果,則是谷歌被迫向出版商支付被稱為“鏈接稅”的費(fèi)用。既然斗爭已經(jīng)取得了階段性勝利,生成式AI加入搜索引擎為什么又會讓出版商感到恐懼呢?其實(shí)這與AI搜索引擎的運(yùn)行模式有著密切的關(guān)系。用《華盛頓郵報(bào)》評價谷歌AI搜索的話來說,就是谷歌現(xiàn)在將利用網(wǎng)絡(luò)資源來創(chuàng)建自己的內(nèi)容,而不是像過去20年那樣,鏈接、引用和總結(jié)其他網(wǎng)站的內(nèi)容。
作為一個古老的互聯(lián)網(wǎng)產(chǎn)品,搜索引擎在時代的不斷變遷里似乎始終如一,甚至在1998年使用谷歌搜索和在2022年使用的體驗(yàn)并沒有本質(zhì)上的差異,同樣都是顯示出一堆鏈接,只不過在UI設(shè)計(jì)上更加人性化、并且多了一點(diǎn)廣告而已。但非常遺憾的是,網(wǎng)絡(luò)信息的爆發(fā)式增長,已經(jīng)出乎了拉里·佩奇和謝爾蓋·布林的意料之外,如今互聯(lián)網(wǎng)上充斥著大量同質(zhì)化的低信息熵內(nèi)容,搜索引擎僅僅依靠“關(guān)鍵詞”的檢索邏輯,也已經(jīng)無法準(zhǔn)確地過濾噪音。
沒錯,傳統(tǒng)搜索引擎的問題,就在于它只能扮演“搬運(yùn)工”這個角色,而無法代替人腦完成信息的篩選甄別,而生成式AI加持的搜索引擎則可以在一定程度上代替用戶的大腦。
但問題就出在了AI搜索能夠利用網(wǎng)絡(luò)資源創(chuàng)建自己的內(nèi)容上,如今已經(jīng)存在谷歌聊天機(jī)器人Bard給出的回答中,有來自其他網(wǎng)站的內(nèi)容被改寫、但沒有注明歸屬的例子。即AI搜索存在侵犯出版商版權(quán)的可能,而這可是在挖出版商的命根子,因此也意味著出版業(yè)的根基或面臨著被動搖的風(fēng)險(xiǎn)。
在過去的幾年時間里,出版商與谷歌矛盾的關(guān)鍵是利益分配不均,出版商方面認(rèn)為谷歌利用他們的內(nèi)容,讓用戶留在他們的生態(tài)中,再通過追蹤用戶在閱讀這些內(nèi)容時的行為數(shù)據(jù)來不斷改善和更新功能,最終為其廣告業(yè)務(wù)服務(wù)??墒窃趶V告市場,廣告主們發(fā)現(xiàn),既然出版商和谷歌服務(wù)的是同一群讀者,顯然投廣告給平臺更大的谷歌更有效果,因此出版商最后發(fā)現(xiàn),他們免費(fèi)提供給谷歌的內(nèi)容,正在成為絞死自己的套索。
出版商認(rèn)為自己的內(nèi)容沒能賣上一個好價錢,因此就想要讓谷歌“多出點(diǎn)血”。在這樣的一場斗爭里,出版商手里的武器是版權(quán),谷歌既然使用了有版權(quán)的內(nèi)容、自然就需要付費(fèi)。
而AI搜索的問題,就在于出版商無法證明谷歌搜索使用的內(nèi)容是來自他們,AI搜索并非內(nèi)容的搬運(yùn)工、而是在創(chuàng)造內(nèi)容。盡管谷歌訓(xùn)練Bard的語料大概率是來源于出版商,但這一點(diǎn)出版商并沒有能力去證明,畢竟生成式AI的智慧如何產(chǎn)生是存在諸多“黑箱”的。例如根據(jù)ChatGPT的回答來反推它使用了哪些語料,根本就是不太可能完成的任務(wù)。
如果說谷歌有能力自己生產(chǎn)內(nèi)容也就罷了,可它沒有這個能力。眾所周知,生成式AI的原理,大概可以總結(jié)為通過大量的語料庫進(jìn)行訓(xùn)練、以建立相應(yīng)的模型,從而使得AI能夠?qū)θ祟惖膯栴}作出相應(yīng)的回答和決策,可無論是OpenAI、谷歌,還是百度,他們訓(xùn)練AI的語料都是買來的。所以谷歌的AI搜索必然會使用到其他出版商的內(nèi)容來填充語料庫,可出版商又沒能力甄別谷歌AI搜索產(chǎn)出的內(nèi)容,到底是不是建立在自家內(nèi)容的基礎(chǔ)上。
所以不難發(fā)現(xiàn),這AI搜索不就是出版商的末日嗎。即便是在版權(quán)歸屬明晰的時代,谷歌方面都不樂意為內(nèi)容付費(fèi),到了AI搜索模糊版權(quán)的情況下,他們顯然就更沒有理由掏錢了,那么出版商不是得去喝西北風(fēng)。因此最有可能出現(xiàn)的情況,就是既然出版商無法判斷生成式AI到底有沒有抓取他們網(wǎng)站上的內(nèi)容,他們或許就更樂意學(xué)習(xí)Twitter、Reddit的策略,對訪問其數(shù)據(jù)的行為收費(fèi)。
換而言之,谷歌的AI搜索可能反而會弄巧成拙,而出于被AI搜索未經(jīng)同意就擅自使用自家版權(quán)內(nèi)容的恐懼,出版商可能會讓谷歌的爬蟲為它的每一次訪問付費(fèi)了。
本文標(biāo)題: 谷歌生成式AI引入搜索引擎 出版商有話說
本文地址: http://www.eat023.com/brand/news-00g8248be.html
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com
2009-2024 黃頁88版權(quán)所有 京ICP備2023012932號-1 │ 京公網(wǎng)安備 11010802023561號 京ICP證100626
內(nèi)容均來源于網(wǎng)絡(luò),錯誤糾正或刪除請發(fā)郵件,收件郵箱kefu@huangye88.com