IT之家 6月28日消息,隨著生成式AI的低成本化,越來越多使用爬蟲抓取其他網(wǎng)站內(nèi)容,并用AI重新生成信息的“垃圾網(wǎng)站”不斷涌出,目前外媒NewsGuard發(fā)布相關(guān)數(shù)據(jù)報告,稱目前已經(jīng)追蹤到了200余個此類“垃圾網(wǎng)站”。
據(jù)悉,NewsGuard從今年年初開始標(biāo)記這些使用AI生成內(nèi)容的網(wǎng)站,在今年4月時,他們登記了49個相關(guān)網(wǎng)站,到了6月則已超過200個,而這些“AI垃圾場”缺乏人類監(jiān)管,其中消息魚龍混雜,沒有任何可信度,完全是為了從Google Ads中薅羊毛而生。
圖源NewsGuard
調(diào)查顯示,這些“垃圾網(wǎng)站”存在的目的就是誘導(dǎo)用戶點(diǎn)擊訪問,并通過其中顯示的廣告賺取收入,其中名為TNN的網(wǎng)站甚至每天可生成逾1200篇文章,該網(wǎng)站完全由爬蟲及“轉(zhuǎn)換語法后重寫一遍”的AI腳本控制,相較之下,《紐約時報》網(wǎng)站每天平均僅發(fā)布150篇文章。
圖源NewsGuard
圖源NewsGuard
截至6月26日,AI“垃圾網(wǎng)站”已經(jīng)追蹤標(biāo)記了277個站點(diǎn),這些網(wǎng)站涵蓋了13種語言,包括中文、英文、阿拉伯語、捷克語、荷蘭語、法文、印尼文、意大利文、韓文、葡萄牙語、他加祿語(菲律賓)、泰文及土耳其語等。
IT之家注意到,實(shí)際上這種利用爬蟲批量爬取其他媒體資訊信息,并在爬取的資訊頁面中加上大量廣告,并通過“競價排名”吸引訪問者,進(jìn)而獲取廣告補(bǔ)貼的網(wǎng)站,在AI時代來臨前就已經(jīng)相當(dāng)常見,而生成式AI的普及只是給予了這些網(wǎng)站更低的營運(yùn)成本。
圖源Pexels
而谷歌的廣告政策明確表示,不允許在自動生成的內(nèi)容網(wǎng)站文章中使用Google Ads API,但這些網(wǎng)站實(shí)際上每個新聞頁都有3-5個廣告鏈接,因此實(shí)際也違反了谷歌的廣告政策。