在Facebook和其他社交媒體平臺上最常見的分享內(nèi)容之一是照片。雖然大多數(shù)社交媒體用戶都能看懂一張圖片,并了解它所代表的內(nèi)容,但對于那些盲人或視障人士來說就不那么容易了。Facebook表示,屏幕閱讀器可以使用合成語音描述這些圖片的內(nèi)容,讓盲人或視障用戶能夠理解Facebook feed中的圖片。
然而,許多照片在發(fā)布時沒有alt文字,導(dǎo)致Facebook在2016年推出了自動替代文本(AAT)。該技術(shù)利用對象識別技術(shù)為盲人或視障用戶按需生成照片的描述。自2016年以來,F(xiàn)acebook一直致力于改進(jìn)AAT,并在最近推出了下一代技術(shù)。Facebook在AAT上的進(jìn)步改善了用戶的照片體驗,AAT可以可靠地檢測和識別照片中的概念數(shù)量擴(kuò)大了十倍以上。這意味著沒有描述的照片減少了,提供的描述也更加詳細(xì)。AAT可以識別活動、地標(biāo)、動物類型等等。
AAT現(xiàn)在會給出這樣的描述:"可能是兩個人的自拍,戶外,比薩斜塔"。Facebook還表示,能夠在照片中加入有關(guān)元素的潛在位置和相對大小的信息是行業(yè)首創(chuàng)。它不是簡單地描述"可能是五人的合影",而是描述成“兩個人在照片的中心,另外三個人向邊緣分散?!?/span>
Facebook表示,這一進(jìn)步可以幫助盲人或視力受損的用戶更好地理解家人和朋友發(fā)布照片中的內(nèi)容。最新版本的AAT使用了一個在數(shù)十億張Instagram公開圖片和標(biāo)簽數(shù)據(jù)上訓(xùn)練出來的模型。訓(xùn)練后產(chǎn)生的模型更加準(zhǔn)確,并且在文化和人口統(tǒng)計方面更具包容性。改進(jìn)后的AAT可以可靠地識別1200多個概念。