熱門文章
算法促進(jìn)人工智能時(shí)代的信息傳播
發(fā)布時(shí)間:2019-07-01 分類:趨勢研究
作者:字節(jié)跳動(dòng)公共政策研究院 袁 祥 王 一
信息智能推薦算法是人工智能技術(shù)在信息傳播領(lǐng)域的應(yīng)用,它極大地提高了信息的生產(chǎn)和傳播效率,帶來了傳播方式和傳播活動(dòng)的深刻變革,同時(shí)也引發(fā)了監(jiān)管部門和用戶對這一新技術(shù)運(yùn)用中出現(xiàn)的內(nèi)容質(zhì)量和價(jià)值觀問題、算法黑箱和信息繭房風(fēng)險(xiǎn)等多方面的關(guān)切和疑慮。面對這些關(guān)切和疑慮,學(xué)界進(jìn)行了持續(xù)研究分析,互聯(lián)網(wǎng)信息平臺(tái)不斷探索問題的解決和風(fēng)險(xiǎn)的防控,推動(dòng)智能推薦技術(shù)的優(yōu)化創(chuàng)新,以期把握算法的特點(diǎn)、價(jià)值和規(guī)律,促進(jìn)人工智能時(shí)代信息傳播的健康發(fā)展、安全發(fā)展。
算法不是信息傳播中社會(huì)價(jià)值弱化的根源
媒體進(jìn)入大眾化和市場化時(shí)代以來,內(nèi)容的低俗、低質(zhì)和娛樂化傾向就開始顯現(xiàn),給主流價(jià)值的傳播帶來挑戰(zhàn)。進(jìn)入信息智能推薦算法時(shí)代,這一趨勢還在延續(xù),并有了新的表現(xiàn)形式。根本原因在于,大眾偏好的內(nèi)容往往不等同于優(yōu)質(zhì)的內(nèi)容,而用戶的需要、市場的要求是媒介技術(shù)發(fā)展的主要推動(dòng)力,客觀上助長了內(nèi)容生態(tài)的低質(zhì)化。
從算法設(shè)計(jì)的初衷看,其本身并不會(huì)提倡標(biāo)題黨、煽情和低俗化內(nèi)容,但由于智能推薦算法要經(jīng)由網(wǎng)上海量的數(shù)據(jù)來訓(xùn)練和生成,而在全網(wǎng)已經(jīng)存在大量低質(zhì)化信息和大眾化審美品位沒有得到根本提升的情況下,加之設(shè)計(jì)算法的工程師沒有經(jīng)過專業(yè)的新聞倫理訓(xùn)練,主要關(guān)注內(nèi)容和用戶興趣的匹配度等指標(biāo),缺乏社會(huì)價(jià)值意識(shí),在算法發(fā)展的初期也沒有將對社會(huì)價(jià)值的導(dǎo)向要求和對低質(zhì)信息的把關(guān)需要內(nèi)化為算法的具體規(guī)則,在客觀上呈現(xiàn)出推薦內(nèi)容的低質(zhì)化傾向。如果說在門戶網(wǎng)站和社交網(wǎng)絡(luò)時(shí)代,不符合用戶偏好的信息還能經(jīng)由編輯的專業(yè)推薦或關(guān)系鏈中其他人的轉(zhuǎn)發(fā)推薦而有一定的傳播空間,那么在算法時(shí)代,不同內(nèi)容之間的“馬太效應(yīng)”更加凸顯,符合偏好的內(nèi)容可以經(jīng)由算法的逐級(jí)放大有更廣泛的影響,而其他內(nèi)容則很難有生存空間。
算法并不必然助長內(nèi)容生態(tài)的低質(zhì)化。這要從算法設(shè)計(jì)的主要特征分析,分為個(gè)體、群體、整體三個(gè)層次的特征:對個(gè)體用戶,算法一般通過對內(nèi)容特征、人的特征、環(huán)境特征三個(gè)維度指標(biāo)的分析,在特定人和特定內(nèi)容之間做出力求精準(zhǔn)的匹配。內(nèi)容特征可能包括領(lǐng)域分類、主題詞、實(shí)體詞、來源、質(zhì)量評(píng)分、相似文章等指標(biāo),人的特征包括興趣、年齡、性別、職業(yè)、使用行為、機(jī)型等指標(biāo),環(huán)境特征包括時(shí)間、地點(diǎn)、天氣和網(wǎng)絡(luò)類型等。在群體層面,算法通過尋找不同用戶在興趣分類、主題、實(shí)體詞和使用行為上的相似性,將一個(gè)用戶感興趣的內(nèi)容推薦給另一個(gè)人,這已不是基于用戶自己的歷史行為,而是基于群體隱性關(guān)聯(lián)之上的協(xié)同推薦。就網(wǎng)民整體,算法則基于內(nèi)容的熱度特征,包括全平臺(tái)的熱點(diǎn)文章或不同類別、主題和關(guān)鍵詞的熱點(diǎn)內(nèi)容,在“冷啟動(dòng)”階段對新用戶進(jìn)行初步推薦。
要扭轉(zhuǎn)社交時(shí)代以來內(nèi)容低質(zhì)化的趨勢,需要智能信息分發(fā)平臺(tái)將社會(huì)責(zé)任意識(shí)主動(dòng)地融入算法設(shè)計(jì)。算法的市場目標(biāo)分為中短期目標(biāo)和長期目標(biāo),中短期目標(biāo)是幾個(gè)小時(shí)、一兩天之內(nèi)用戶的興趣匹配,是為了提升點(diǎn)擊率和收藏、轉(zhuǎn)發(fā)、評(píng)論等行為,而長期目標(biāo)是實(shí)現(xiàn)用戶的穩(wěn)定留存和活躍使用。很多時(shí)候,短期目標(biāo)對實(shí)現(xiàn)長期目標(biāo)并沒有幫助,有時(shí)候反而起反作用。以標(biāo)題黨現(xiàn)象為例,劣質(zhì)創(chuàng)作者通過噱頭可以吸引用戶點(diǎn)擊,使點(diǎn)擊率虛高,用戶可能會(huì)留下負(fù)面評(píng)價(jià),表面上提高了參與度,但卻以犧牲用戶體驗(yàn)和影響留存為代價(jià),類似含水的點(diǎn)擊率和負(fù)面的評(píng)論率,不符合信息平臺(tái)的長遠(yuǎn)利益。
當(dāng)前智能分發(fā)已成為新聞資訊客戶端、瀏覽器等應(yīng)用的“標(biāo)配”手段,從行業(yè)實(shí)踐看,居于頭部領(lǐng)先位置的App更重視用戶的長期留存,更傾向于主動(dòng)避免內(nèi)容低質(zhì)化帶來的社會(huì)輿論和監(jiān)管風(fēng)險(xiǎn)。字節(jié)跳動(dòng)公司最早將智能推薦算法應(yīng)用在信息分發(fā)領(lǐng)域,在發(fā)展早期也存在內(nèi)容質(zhì)量問題和算法偏向市場化的問題,近年通過設(shè)置更多元的算法目標(biāo),綜合分析用戶瀏覽時(shí)長、評(píng)論情感傾向來打擊標(biāo)題黨、煽情化等劣質(zhì)內(nèi)容,通過技術(shù)模型過濾有害信息和黃賭毒等違法違規(guī)內(nèi)容,并基于正能量信息的模型訓(xùn)練來加強(qiáng)主流價(jià)值信息的推薦。例如,信息平臺(tái)通過對上百萬篇網(wǎng)信部門宣傳報(bào)道指令、黨報(bào)黨刊要聞等正能量信息的人工標(biāo)注,作為機(jī)器學(xué)習(xí)的模型訓(xùn)練集,模型經(jīng)過不斷優(yōu)化,對新時(shí)代建設(shè)等主流價(jià)值觀內(nèi)容的識(shí)別率準(zhǔn)確超過93%。算法對識(shí)別出的文章進(jìn)行1.5-2倍的加權(quán)推薦,目前正能量模型識(shí)別范圍已涵蓋凡人善舉、行業(yè)榜樣、知識(shí)普惠、公益慈善等眾多領(lǐng)域,平臺(tái)內(nèi)容日益多元優(yōu)質(zhì),生態(tài)越來越有益健康。而一些“信息流”平臺(tái)則表現(xiàn)出打擦邊球的意愿和行動(dòng),以對低俗化內(nèi)容的推薦來實(shí)現(xiàn)短期用戶量的“沖高”,美女、大尺度、追星、偶像成為內(nèi)容關(guān)鍵詞,這些信息經(jīng)推薦算法進(jìn)一步放大了對用戶,特別是青少年用戶的影響。這已引發(fā)社會(huì)關(guān)切和監(jiān)管層的關(guān)注,已督促改進(jìn)。但效果尚不明顯,需要加大監(jiān)管力度。
在智能分發(fā)時(shí)代,要解決內(nèi)容的低俗化低質(zhì)化和社會(huì)價(jià)值弱化問題,要從兩方面同時(shí)入手、同步加強(qiáng)。一要解決內(nèi)容生產(chǎn)的低質(zhì)化問題,壓實(shí)社交平臺(tái)、信息平臺(tái)和創(chuàng)作者的社會(huì)責(zé)任,提升全體用戶的道德素質(zhì)和網(wǎng)絡(luò)素養(yǎng)。社交網(wǎng)絡(luò)極大賦能了用戶的創(chuàng)作權(quán)、表達(dá)權(quán)、傳播權(quán),一個(gè)個(gè)用戶需求和內(nèi)容產(chǎn)出匯聚起來,越發(fā)影響著網(wǎng)上信息的議程設(shè)置和導(dǎo)向,如果此時(shí)的內(nèi)容生態(tài)不健康,那么“沒有一片雪花是無辜的”,而現(xiàn)實(shí)是大多數(shù)用戶基于原始的本能,傾向于好玩的、娛樂的、低俗的內(nèi)容。這不同于傳統(tǒng)媒體時(shí)代,新聞機(jī)構(gòu)有強(qiáng)大的社會(huì)影響力,但也負(fù)有高度的責(zé)任和使命。社交平臺(tái)、信息平臺(tái)的海量信息是推薦算法發(fā)揮作用的土壤,在個(gè)體賦權(quán)的同時(shí),用戶也需要權(quán)責(zé)平衡,要以多種方式有效提升普通人的道德素質(zhì)、媒介素養(yǎng)、算法知識(shí)、責(zé)任意識(shí)和法紀(jì)觀念,創(chuàng)作者要確保一開始就生產(chǎn)高質(zhì)量的內(nèi)容,平臺(tái)更主動(dòng)發(fā)揮自我監(jiān)管的責(zé)任,才能從源頭上建立優(yōu)質(zhì)的內(nèi)容生態(tài)。
二要實(shí)現(xiàn)社會(huì)價(jià)值融入算法設(shè)計(jì),發(fā)揮對內(nèi)容生產(chǎn)和傳播的“獎(jiǎng)優(yōu)罰劣”把關(guān)作用,盡快邁向智能管網(wǎng)治網(wǎng)。算法幫助用戶以更智能、更高效的方式行使對內(nèi)容的選擇權(quán)利,客觀上具有對內(nèi)容創(chuàng)作的引導(dǎo)作用,商業(yè)媒體、自媒體等都會(huì)研究和分析不同平臺(tái)的算法特點(diǎn),謀求更多的內(nèi)容推薦和傳播。如果算法中融入了社會(huì)價(jià)值,就會(huì)促進(jìn)內(nèi)容生態(tài)向更健康的方向發(fā)展。如果說落實(shí)平臺(tái)責(zé)任、提升用戶素質(zhì)是為了盡量減少網(wǎng)上的“淤泥”,而對算法的優(yōu)化則是為了做到“出淤泥而不染”。之前是將價(jià)值堅(jiān)守融入專業(yè)媒體人的工作,算法時(shí)代要將主流價(jià)值觀念、信息傳播倫理融入工程師的設(shè)計(jì)目標(biāo)和流程,由于代碼被認(rèn)為是網(wǎng)絡(luò)空間的“法律”,這樣做可以將制度的宏觀原則融入技術(shù)的微觀建構(gòu)之中。作者:字節(jié)跳動(dòng)公共政策研究院 袁 祥 王 一
信息智能推薦算法是人工智能技術(shù)在信息傳播領(lǐng)域的應(yīng)用,它極大地提高了信息的生產(chǎn)和傳播效率,帶來了傳播方式和傳播活動(dòng)的深刻變革,同時(shí)也引發(fā)了監(jiān)管部門和用戶對這一新技術(shù)運(yùn)用中出現(xiàn)的內(nèi)容質(zhì)量和價(jià)值觀問題、算法黑箱和信息繭房風(fēng)險(xiǎn)等多方面的關(guān)切和疑慮。面對這些關(guān)切和疑慮,學(xué)界進(jìn)行了持續(xù)研究分析,互聯(lián)網(wǎng)信息平臺(tái)不斷探索問題的解決和風(fēng)險(xiǎn)的防控,推動(dòng)智能推薦技術(shù)的優(yōu)化創(chuàng)新,以期把握算法的特點(diǎn)、價(jià)值和規(guī)律,促進(jìn)人工智能時(shí)代信息傳播的健康發(fā)展、安全發(fā)展。
算法不是信息傳播中社會(huì)價(jià)值弱化的根源
媒體進(jìn)入大眾化和市場化時(shí)代以來,內(nèi)容的低俗、低質(zhì)和娛樂化傾向就開始顯現(xiàn),給主流價(jià)值的傳播帶來挑戰(zhàn)。進(jìn)入信息智能推薦算法時(shí)代,這一趨勢還在延續(xù),并有了新的表現(xiàn)形式。根本原因在于,大眾偏好的內(nèi)容往往不等同于優(yōu)質(zhì)的內(nèi)容,而用戶的需要、市場的要求是媒介技術(shù)發(fā)展的主要推動(dòng)力,客觀上助長了內(nèi)容生態(tài)的低質(zhì)化。
從算法設(shè)計(jì)的初衷看,其本身并不會(huì)提倡標(biāo)題黨、煽情和低俗化內(nèi)容,但由于智能推薦算法要經(jīng)由網(wǎng)上海量的數(shù)據(jù)來訓(xùn)練和生成,而在全網(wǎng)已經(jīng)存在大量低質(zhì)化信息和大眾化審美品位沒有得到根本提升的情況下,加之設(shè)計(jì)算法的工程師沒有經(jīng)過專業(yè)的新聞倫理訓(xùn)練,主要關(guān)注內(nèi)容和用戶興趣的匹配度等指標(biāo),缺乏社會(huì)價(jià)值意識(shí),在算法發(fā)展的初期也沒有將對社會(huì)價(jià)值的導(dǎo)向要求和對低質(zhì)信息的把關(guān)需要內(nèi)化為算法的具體規(guī)則,在客觀上呈現(xiàn)出推薦內(nèi)容的低質(zhì)化傾向。如果說在門戶網(wǎng)站和社交網(wǎng)絡(luò)時(shí)代,不符合用戶偏好的信息還能經(jīng)由編輯的專業(yè)推薦或關(guān)系鏈中其他人的轉(zhuǎn)發(fā)推薦而有一定的傳播空間,那么在算法時(shí)代,不同內(nèi)容之間的“馬太效應(yīng)”更加凸顯,符合偏好的內(nèi)容可以經(jīng)由算法的逐級(jí)放大有更廣泛的影響,而其他內(nèi)容則很難有生存空間。
算法并不必然助長內(nèi)容生態(tài)的低質(zhì)化。這要從算法設(shè)計(jì)的主要特征分析,分為個(gè)體、群體、整體三個(gè)層次的特征:對個(gè)體用戶,算法一般通過對內(nèi)容特征、人的特征、環(huán)境特征三個(gè)維度指標(biāo)的分析,在特定人和特定內(nèi)容之間做出力求精準(zhǔn)的匹配。內(nèi)容特征可能包括領(lǐng)域分類、主題詞、實(shí)體詞、來源、質(zhì)量評(píng)分、相似文章等指標(biāo),人的特征包括興趣、年齡、性別、職業(yè)、使用行為、機(jī)型等指標(biāo),環(huán)境特征包括時(shí)間、地點(diǎn)、天氣和網(wǎng)絡(luò)類型等。在群體層面,算法通過尋找不同用戶在興趣分類、主題、實(shí)體詞和使用行為上的相似性,將一個(gè)用戶感興趣的內(nèi)容推薦給另一個(gè)人,這已不是基于用戶自己的歷史行為,而是基于群體隱性關(guān)聯(lián)之上的協(xié)同推薦。就網(wǎng)民整體,算法則基于內(nèi)容的熱度特征,包括全平臺(tái)的熱點(diǎn)文章或不同類別、主題和關(guān)鍵詞的熱點(diǎn)內(nèi)容,在“冷啟動(dòng)”階段對新用戶進(jìn)行初步推薦。
要扭轉(zhuǎn)社交時(shí)代以來內(nèi)容低質(zhì)化的趨勢,需要智能信息分發(fā)平臺(tái)將社會(huì)責(zé)任意識(shí)主動(dòng)地融入算法設(shè)計(jì)。算法的市場目標(biāo)分為中短期目標(biāo)和長期目標(biāo),中短期目標(biāo)是幾個(gè)小時(shí)、一兩天之內(nèi)用戶的興趣匹配,是為了提升點(diǎn)擊率和收藏、轉(zhuǎn)發(fā)、評(píng)論等行為,而長期目標(biāo)是實(shí)現(xiàn)用戶的穩(wěn)定留存和活躍使用。很多時(shí)候,短期目標(biāo)對實(shí)現(xiàn)長期目標(biāo)并沒有幫助,有時(shí)候反而起反作用。以標(biāo)題黨現(xiàn)象為例,劣質(zhì)創(chuàng)作者通過噱頭可以吸引用戶點(diǎn)擊,使點(diǎn)擊率虛高,用戶可能會(huì)留下負(fù)面評(píng)價(jià),表面上提高了參與度,但卻以犧牲用戶體驗(yàn)和影響留存為代價(jià),類似含水的點(diǎn)擊率和負(fù)面的評(píng)論率,不符合信息平臺(tái)的長遠(yuǎn)利益。
當(dāng)前智能分發(fā)已成為新聞資訊客戶端、瀏覽器等應(yīng)用的“標(biāo)配”手段,從行業(yè)實(shí)踐看,居于頭部領(lǐng)先位置的App更重視用戶的長期留存,更傾向于主動(dòng)避免內(nèi)容低質(zhì)化帶來的社會(huì)輿論和監(jiān)管風(fēng)險(xiǎn)。字節(jié)跳動(dòng)公司最早將智能推薦算法應(yīng)用在信息分發(fā)領(lǐng)域,在發(fā)展早期也存在內(nèi)容質(zhì)量問題和算法偏向市場化的問題,近年通過設(shè)置更多元的算法目標(biāo),綜合分析用戶瀏覽時(shí)長、評(píng)論情感傾向來打擊標(biāo)題黨、煽情化等劣質(zhì)內(nèi)容,通過技術(shù)模型過濾有害信息和黃賭毒等違法違規(guī)內(nèi)容,并基于正能量信息的模型訓(xùn)練來加強(qiáng)主流價(jià)值信息的推薦。例如,信息平臺(tái)通過對上百萬篇網(wǎng)信部門宣傳報(bào)道指令、黨報(bào)黨刊要聞等正能量信息的人工標(biāo)注,作為機(jī)器學(xué)習(xí)的模型訓(xùn)練集,模型經(jīng)過不斷優(yōu)化,對新時(shí)代建設(shè)等主流價(jià)值觀內(nèi)容的識(shí)別率準(zhǔn)確超過93%。算法對識(shí)別出的文章進(jìn)行1.5-2倍的加權(quán)推薦,目前正能量模型識(shí)別范圍已涵蓋凡人善舉、行業(yè)榜樣、知識(shí)普惠、公益慈善等眾多領(lǐng)域,平臺(tái)內(nèi)容日益多元優(yōu)質(zhì),生態(tài)越來越有益健康。而一些“信息流”平臺(tái)則表現(xiàn)出打擦邊球的意愿和行動(dòng),以對低俗化內(nèi)容的推薦來實(shí)現(xiàn)短期用戶量的“沖高”,美女、大尺度、追星、偶像成為內(nèi)容關(guān)鍵詞,這些信息經(jīng)推薦算法進(jìn)一步放大了對用戶,特別是青少年用戶的影響。這已引發(fā)社會(huì)關(guān)切和監(jiān)管層的關(guān)注,已督促改進(jìn)。但效果尚不明顯,需要加大監(jiān)管力度。
在智能分發(fā)時(shí)代,要解決內(nèi)容的低俗化低質(zhì)化和社會(huì)價(jià)值弱化問題,要從兩方面同時(shí)入手、同步加強(qiáng)。一要解決內(nèi)容生產(chǎn)的低質(zhì)化問題,壓實(shí)社交平臺(tái)、信息平臺(tái)和創(chuàng)作者的社會(huì)責(zé)任,提升全體用戶的道德素質(zhì)和網(wǎng)絡(luò)素養(yǎng)。社交網(wǎng)絡(luò)極大賦能了用戶的創(chuàng)作權(quán)、表達(dá)權(quán)、傳播權(quán),一個(gè)個(gè)用戶需求和內(nèi)容產(chǎn)出匯聚起來,越發(fā)影響著網(wǎng)上信息的議程設(shè)置和導(dǎo)向,如果此時(shí)的內(nèi)容生態(tài)不健康,那么“沒有一片雪花是無辜的”,而現(xiàn)實(shí)是大多數(shù)用戶基于原始的本能,傾向于好玩的、娛樂的、低俗的內(nèi)容。這不同于傳統(tǒng)媒體時(shí)代,新聞機(jī)構(gòu)有強(qiáng)大的社會(huì)影響力,但也負(fù)有高度的責(zé)任和使命。社交平臺(tái)、信息平臺(tái)的海量信息是推薦算法發(fā)揮作用的土壤,在個(gè)體賦權(quán)的同時(shí),用戶也需要權(quán)責(zé)平衡,要以多種方式有效提升普通人的道德素質(zhì)、媒介素養(yǎng)、算法知識(shí)、責(zé)任意識(shí)和法紀(jì)觀念,創(chuàng)作者要確保一開始就生產(chǎn)高質(zhì)量的內(nèi)容,平臺(tái)更主動(dòng)發(fā)揮自我監(jiān)管的責(zé)任,才能從源頭上建立優(yōu)質(zhì)的內(nèi)容生態(tài)。
二要實(shí)現(xiàn)社會(huì)價(jià)值融入算法設(shè)計(jì),發(fā)揮對內(nèi)容生產(chǎn)和傳播的“獎(jiǎng)優(yōu)罰劣”把關(guān)作用,盡快邁向智能管網(wǎng)治網(wǎng)。算法幫助用戶以更智能、更高效的方式行使對內(nèi)容的選擇權(quán)利,客觀上具有對內(nèi)容創(chuàng)作的引導(dǎo)作用,商業(yè)媒體、自媒體等都會(huì)研究和分析不同平臺(tái)的算法特點(diǎn),謀求更多的內(nèi)容推薦和傳播。如果算法中融入了社會(huì)價(jià)值,就會(huì)促進(jìn)內(nèi)容生態(tài)向更健康的方向發(fā)展。如果說落實(shí)平臺(tái)責(zé)任、提升用戶素質(zhì)是為了盡量減少網(wǎng)上的“淤泥”,而對算法的優(yōu)化則是為了做到“出淤泥而不染”。之前是將價(jià)值堅(jiān)守融入專業(yè)媒體人的工作,算法時(shí)代要將主流價(jià)值觀念、信息傳播倫理融入工程師的設(shè)計(jì)目標(biāo)和流程,由于代碼被認(rèn)為是網(wǎng)絡(luò)空間的“法律”,這樣做可以將制度的宏觀原則融入技術(shù)的微觀建構(gòu)之中。