Meta研究人員創(chuàng)建人工智能系統(tǒng),來編寫出維基百科風(fēng)格的傳記草稿,使得維基百科編輯能夠以最少的編輯,在維基百科上提供女性人物的傳記,以補(bǔ)充目前維基百科上,男女性人物傳記數(shù)量失衡的狀況。
維基百科一直是全球訪問量前10名的網(wǎng)站,是許多人搜索歷史人物與領(lǐng)創(chuàng)者資訊的第一站,但這些人的傳記,并不總是被平等的呈現(xiàn)在維基百科上,根據(jù)維基媒體自己的研究資料,英文網(wǎng)站上只有大約20%的傳記是關(guān)于女性。Meta研究人員提到,交叉性群體像是科學(xué)界女性、非洲女性或是亞洲女性的傳記數(shù)量可能更少。
雖然女性可能更傾向于撰寫其他女性的傳記,但Meta研究人員在維基媒體《2021年社群洞察報(bào)告》中發(fā)現(xiàn),維基百科中只有15%的編輯是女性,他們提到,女性在歷史上,對科學(xué)、政治、社會(huì)甚至是企業(yè)家精神,都產(chǎn)生巨大的影響,但是這些女性人物卻被忽視,或是被以不成比例的方式在維基百科上呈現(xiàn)。
研究人員舉例,像是加拿大物理學(xué)家Donna Strickland,在2018年的時(shí)候獲得諾貝爾物理學(xué)獎(jiǎng),卻在維基百科上無法找到任何關(guān)于他的資訊,一直到Donna Strickland獲得該領(lǐng)域最大的獎(jiǎng)項(xiàng),他的傳記才終于被發(fā)布。
因此Meta研究人員,開發(fā)了一個(gè)端到端人工智能模型,作為解決問題的起點(diǎn),該模型能夠自動(dòng)創(chuàng)建現(xiàn)實(shí)公眾人物的傳記文章。模型會(huì)先在網(wǎng)絡(luò)上搜索相關(guān)的資訊,并且寫出關(guān)于該人物的維基百科式條目,并且附上引用資料。
由于該人工智能系統(tǒng)仍還存在一些限制,因此定位上需要能與維基百科編輯互補(bǔ),由人工智能系統(tǒng)產(chǎn)生草稿,接著再由編輯進(jìn)行事實(shí)查證和補(bǔ)充。模型的限制包括,用來創(chuàng)建維基百科條目的網(wǎng)頁內(nèi)容,可能存在文化偏見,而且在技術(shù)上,文本生成系統(tǒng)容易產(chǎn)生幻覺(Hallucination),也就是非事實(shí)的內(nèi)容。
以下彩色文本,是由模型替無脊椎動(dòng)物的研究先驅(qū)Libbie Hyman,所生成的簡短傳記,綠色文本來自參照文章,紫色文本則來自網(wǎng)絡(luò)上的證據(jù),橘色文本則表示幻覺,是由模型腦補(bǔ),無法被驗(yàn)證的資訊。
雖然模型所生成的結(jié)果無法直接被使用,但是模型檢索了Libbie Hyman相關(guān)資料,包括對無脊椎動(dòng)物的研究、重要出版物和工作等,使得維基百科編輯能根據(jù)這項(xiàng)基礎(chǔ),借由驗(yàn)證內(nèi)容的正確性,并且補(bǔ)充Libbie Hyman的生活和成就,更快速地完成傳記。
雖然在技術(shù)上還是有不足的地方,但這卻是對維基百科內(nèi)容的性別平等踏出重要的一步,這項(xiàng)研究接下來還有許多工作要做,研究人員提到,他們目前的工作,僅是解決一個(gè)復(fù)雜問題的一小部分,其他問題像是在參照網(wǎng)絡(luò)資料時(shí),女性的傳記通常包含更多額外的生活細(xì)節(jié),像是離婚這個(gè)詞,出現(xiàn)在女性傳記的頻率是男性傳記的4倍,來自小報(bào)的素材,往往更關(guān)注女性的生活,而這些細(xì)節(jié)可能沖淡更應(yīng)該專注的成就。
Meta研究人員提到,目前該模型把重點(diǎn)擺在女性,不過維基百科上還有許多內(nèi)容存在偏見,根據(jù)維基百科對社群文章偏見的研究,發(fā)現(xiàn)跨性別和二元性別人物的傳記,往往長度更長,但是大部分章節(jié)都是描寫個(gè)人生活,而非個(gè)人成就,因此要在當(dāng)前的內(nèi)容中,識(shí)別不同的偏見形式,也是接下來需要繼續(xù)研究的部分。