IT之家 12月3日消息,據(jù)外媒PC mag報(bào)道,谷歌悄然為Gmail新增了一個(gè)垃圾郵件過濾器,號稱在識別垃圾郵件、網(wǎng)絡(luò)釣魚郵件方面擁有更好表現(xiàn)。
據(jù)介紹,這個(gè)新的垃圾郵件過濾器是基于Google Colab上的新型開源多語言文本矢量化器RETVec(彈性高效文本矢量器)。它可以將單詞映射成矢量或者數(shù)字,從而被用來提升垃圾郵件和釣魚郵件的識別率,同時(shí)降低誤報(bào)率。
由于網(wǎng)絡(luò)犯罪分子仍然持續(xù)創(chuàng)建繞過防御系統(tǒng)的內(nèi)容,導(dǎo)致當(dāng)前文本分類模型在識別詐騙和網(wǎng)絡(luò)釣魚攻擊方面仍存在困難。谷歌方面聲稱,RETVec在經(jīng)過訓(xùn)練之后,能夠檢測并理解“字符級”的操作,包括插入、刪除、拼寫錯(cuò)誤、同音字,同時(shí)還能降低計(jì)算成本。
根據(jù)谷歌自己的統(tǒng)計(jì),將RETVec應(yīng)用到Gmail后,垃圾郵件檢測率相比以往的過濾器提高38%、誤報(bào)率降低19.4%、張量處理單元(TPU)使用率降低了83.13%。
谷歌方面聲稱,使用RETVec訓(xùn)練的模型表現(xiàn)出更快的推理速度,較小的模型可以降低計(jì)算成本并減少延遲,這對于大規(guī)模系統(tǒng)和設(shè)備上的模型至關(guān)重要。