據(jù)外媒TechCrunch報道,每一張發(fā)布到Facebook和Instagram上的圖片都會有一個圖像分析人工智能生成的標題,而且Facebook已對這一人工智能技術(shù)進行升級。改進后的系統(tǒng)對于視障用戶來說應該是一種享受,未來可能會幫助用戶更快地找到照片。
轉(zhuǎn)換文字是圖像元數(shù)據(jù)中描述其內(nèi)容的一個字段:“一個人和田野里的一匹馬”或"船上的一條狗"。這可以讓看不到圖像的人也能理解圖像的內(nèi)容。
這些描述通常是由攝影師或出版物手動添加的,但人們將照片上傳到社交媒體上時,一般不會去做。因此,相對來說,最近能夠自動生成的描述對于讓社交媒體更容易被大眾所接受是非常有幫助的。
Facebook在2016年創(chuàng)建了自動轉(zhuǎn)換文本系統(tǒng)。此后,團隊對其進行了許多改進,使其更快、更詳細,最新的更新增加了一個選項,可以根據(jù)需求生成更詳細的描述。改進后的系統(tǒng)識別的項目和概念比一開始多了10倍,現(xiàn)在大約有1200個。而且描述中包含了更多的細節(jié)。曾經(jīng)的“兩個人在建筑物旁”的描述現(xiàn)在可能是“兩個人在埃菲爾鐵塔旁的自拍”。
但還有比這更多的細節(jié),即使它不一定相關(guān)。例如,在這張圖片中,AI會注意到人和物體的相對位置:
要在Facebook應用中訪問這些詳細的圖像描述,在Android中長按照片,在iOS中使用照片上的"自定義操作"。新的詳細描述功能將首先來到Facebook進行測試,不過改進后的詞匯很快就會出現(xiàn)在Instagram上。描述的內(nèi)容也保持簡單,因此可以很容易地翻譯成其他應用已經(jīng)支持的語言,不過該功能可能不會在其他國家同時推出。