Twitter在今年的7月30日發(fā)起了一項(xiàng)挑戰(zhàn)賽,邀請(qǐng)研究人員尋找其圖像剪裁算法(Image Cropping Algorithm,或稱顯著算法)的偏差,冠軍在今年8月9日出爐,他是洛桑聯(lián)邦理工學(xué)院(EPFL)的機(jī)器學(xué)習(xí)暨隱私的研究生Bogdan Kulynych,披露Twitter的算法偏好纖細(xì)、年輕與皮膚好的對(duì)象,并獲得了Twitter所提供的3,500美元的獎(jiǎng)金。
Twitter上的圖像剪裁工具是通過(guò)算法來(lái)裁剪用戶上傳的圖片,選擇圖片中最顯著的部分作為縮略圖,以方便瀏覽,用戶點(diǎn)擊縮略圖就能看到圖片的全貌。
而該競(jìng)賽的起源可追溯至去年,當(dāng)時(shí)Iqlusion共同創(chuàng)辦人Tony Arcieri通過(guò)Twitter,發(fā)布了許多張內(nèi)置共和黨參議院領(lǐng)袖Mitch McConnell以及美國(guó)前總統(tǒng)Barack Obama的照片,結(jié)果縮略圖都選中了白皮膚的McConnell,隨后即有不少Twitter用戶發(fā)現(xiàn),Twitter的圖像剪裁算法的確偏好白種人。
在該爭(zhēng)議之后,Twitter即展開(kāi)內(nèi)部研究,證明該算法的確存在偏差,并于今年5月暫時(shí)自動(dòng)裁剪圖片,之后在7月發(fā)起圖像剪裁算法的偏差漏洞挖掘競(jìng)賽,邀請(qǐng)外部的研究人員尋找該算法的潛在傷害,打算效法安全漏洞挖掘競(jìng)賽,讓它成為Twitter及整個(gè)產(chǎn)業(yè)的先例。
=獲得第一名的Kulynych通過(guò)GitHub公布了他的研究成果,解釋他先利用一個(gè)大型的計(jì)算機(jī)視覺(jué)模型,放大Twitter圖像剪裁算法模型對(duì)人像的顯著預(yù)測(cè),再針對(duì)這些人像采用定性主題化分析,顯示出Twitter的算法偏好較瘦、較年輕、皮膚顏色較淺、皮膚較細(xì)致,以及具備刻板女性臉部特征的人像。
圖片來(lái)源_Bogdan Kulynych
Kulynych認(rèn)為,當(dāng)實(shí)際部署該算法時(shí),這些內(nèi)部的偏見(jiàn)將因代表性不足而造成傷害,因?yàn)樵撍惴▽⒉眉舻裟切┎环显撍惴ǖ娜讼瘢还苁窃隗w重、年齡或膚色上,可能會(huì)導(dǎo)致少數(shù)群體被排除,同時(shí)在大量的圖像中延續(xù)刻板的美感標(biāo)準(zhǔn)。