Meta研究人員創(chuàng)建人工智能系統(tǒng),來編寫出維基百科風格的傳記草稿,使得維基百科編輯能夠以最少的編輯,在維基百科上提供女性人物的傳記,以補充目前維基百科上,男女性人物傳記數(shù)量失衡的狀況。
維基百科一直是全球訪問量前10名的網站,是許多人搜索歷史人物與領創(chuàng)者資訊的第一站,但這些人的傳記,并不總是被平等的呈現(xiàn)在維基百科上,根據(jù)維基媒體自己的研究資料,英文網站上只有大約20%的傳記是關于女性。Meta研究人員提到,交叉性群體像是科學界女性、非洲女性或是亞洲女性的傳記數(shù)量可能更少。
雖然女性可能更傾向于撰寫其他女性的傳記,但Meta研究人員在維基媒體《2021年社群洞察報告》中發(fā)現(xiàn),維基百科中只有15%的編輯是女性,他們提到,女性在歷史上,對科學、政治、社會甚至是企業(yè)家精神,都產生巨大的影響,但是這些女性人物卻被忽視,或是被以不成比例的方式在維基百科上呈現(xiàn)。
研究人員舉例,像是加拿大物理學家Donna Strickland,在2018年的時候獲得諾貝爾物理學獎,卻在維基百科上無法找到任何關于他的資訊,一直到Donna Strickland獲得該領域最大的獎項,他的傳記才終于被發(fā)布。
因此Meta研究人員,開發(fā)了一個端到端人工智能模型,作為解決問題的起點,該模型能夠自動創(chuàng)建現(xiàn)實公眾人物的傳記文章。模型會先在網絡上搜索相關的資訊,并且寫出關于該人物的維基百科式條目,并且附上引用資料。
由于該人工智能系統(tǒng)仍還存在一些限制,因此定位上需要能與維基百科編輯互補,由人工智能系統(tǒng)產生草稿,接著再由編輯進行事實查證和補充。模型的限制包括,用來創(chuàng)建維基百科條目的網頁內容,可能存在文化偏見,而且在技術上,文本生成系統(tǒng)容易產生幻覺(Hallucination),也就是非事實的內容。
以下彩色文本,是由模型替無脊椎動物的研究先驅Libbie Hyman,所生成的簡短傳記,綠色文本來自參照文章,紫色文本則來自網絡上的證據(jù),橘色文本則表示幻覺,是由模型腦補,無法被驗證的資訊。
雖然模型所生成的結果無法直接被使用,但是模型檢索了Libbie Hyman相關資料,包括對無脊椎動物的研究、重要出版物和工作等,使得維基百科編輯能根據(jù)這項基礎,借由驗證內容的正確性,并且補充Libbie Hyman的生活和成就,更快速地完成傳記。
雖然在技術上還是有不足的地方,但這卻是對維基百科內容的性別平等踏出重要的一步,這項研究接下來還有許多工作要做,研究人員提到,他們目前的工作,僅是解決一個復雜問題的一小部分,其他問題像是在參照網絡資料時,女性的傳記通常包含更多額外的生活細節(jié),像是離婚這個詞,出現(xiàn)在女性傳記的頻率是男性傳記的4倍,來自小報的素材,往往更關注女性的生活,而這些細節(jié)可能沖淡更應該專注的成就。
Meta研究人員提到,目前該模型把重點擺在女性,不過維基百科上還有許多內容存在偏見,根據(jù)維基百科對社群文章偏見的研究,發(fā)現(xiàn)跨性別和二元性別人物的傳記,往往長度更長,但是大部分章節(jié)都是描寫個人生活,而非個人成就,因此要在當前的內容中,識別不同的偏見形式,也是接下來需要繼續(xù)研究的部分。