IT之家 6月28日消息,隨著生成式AI的低成本化,越來(lái)越多使用爬蟲抓取其他網(wǎng)站內(nèi)容,并用AI重新生成信息的“垃圾網(wǎng)站”不斷涌出,目前外媒NewsGuard發(fā)布相關(guān)數(shù)據(jù)報(bào)告,稱目前已經(jīng)追蹤到了200余個(gè)此類“垃圾網(wǎng)站”。
據(jù)悉,NewsGuard從今年年初開始標(biāo)記這些使用AI生成內(nèi)容的網(wǎng)站,在今年4月時(shí),他們登記了49個(gè)相關(guān)網(wǎng)站,到了6月則已超過(guò)200個(gè),而這些“AI垃圾場(chǎng)”缺乏人類監(jiān)管,其中消息魚龍混雜,沒(méi)有任何可信度,完全是為了從Google Ads中薅羊毛而生。
圖源NewsGuard
調(diào)查顯示,這些“垃圾網(wǎng)站”存在的目的就是誘導(dǎo)用戶點(diǎn)擊訪問(wèn),并通過(guò)其中顯示的廣告賺取收入,其中名為TNN的網(wǎng)站甚至每天可生成逾1200篇文章,該網(wǎng)站完全由爬蟲及“轉(zhuǎn)換語(yǔ)法后重寫一遍”的AI腳本控制,相較之下,《紐約時(shí)報(bào)》網(wǎng)站每天平均僅發(fā)布150篇文章。
圖源NewsGuard
圖源NewsGuard
截至6月26日,AI“垃圾網(wǎng)站”已經(jīng)追蹤標(biāo)記了277個(gè)站點(diǎn),這些網(wǎng)站涵蓋了13種語(yǔ)言,包括中文、英文、阿拉伯語(yǔ)、捷克語(yǔ)、荷蘭語(yǔ)、法文、印尼文、意大利文、韓文、葡萄牙語(yǔ)、他加祿語(yǔ)(菲律賓)、泰文及土耳其語(yǔ)等。
IT之家注意到,實(shí)際上這種利用爬蟲批量爬取其他媒體資訊信息,并在爬取的資訊頁(yè)面中加上大量廣告,并通過(guò)“競(jìng)價(jià)排名”吸引訪問(wèn)者,進(jìn)而獲取廣告補(bǔ)貼的網(wǎng)站,在AI時(shí)代來(lái)臨前就已經(jīng)相當(dāng)常見(jiàn),而生成式AI的普及只是給予了這些網(wǎng)站更低的營(yíng)運(yùn)成本。
圖源Pexels
而谷歌的廣告政策明確表示,不允許在自動(dòng)生成的內(nèi)容網(wǎng)站文章中使用Google Ads API,但這些網(wǎng)站實(shí)際上每個(gè)新聞頁(yè)都有3-5個(gè)廣告鏈接,因此實(shí)際也違反了谷歌的廣告政策。