📖 ZKIZ Archives


【百佳講壇】將匠心註入機器算法

在新聞資訊領域,人工編輯和機器算法究竟誰更重要?

對於這個問題,今日頭條創始人張一鳴毫不猶豫地選擇了後者。他在最近接受采訪時再次強調了今日頭條不設總編輯以及算法沒有價值觀。在他看來,今日頭條不是一家媒體公司,而是一家科技公司,如果頭條有主編,他不可避免會按照自己的喜好去選擇內容,而頭條做的就是不選擇。。

豌豆莢聯合創始人、輕芒聯合創始人王俊煜卻在知乎上嗆聲:“技術是有價值觀的,取決於你想用來做什麽;面對現實不意味著沈淪於現實之中; 普通人今天也不僅僅需要娛樂,他們除了娛樂以外,也還需要更多。

今日頭條的競爭對手一點資訊,則是挖來了互聯網新聞的教父陳彤。用陳彤自己的話說,未來要在算法的基礎上加入新聞理念和情懷。

而總編輯陳朝華剛剛離職的搜狐,以及騰訊、網易都想要“人工+機器”兩者兼得。按照搜狐的說法,搜狐對新聞內容展示方式進行了調整,采用“編輯流+推薦流”的模式。但兩者究竟怎麽結合,目前外界還沒看到一條清晰的路徑。

 

事實上,如果把這幾件事聯系起來看,背後其實是同一個問題:在新聞資訊領域,如何處理人工編輯和機器算法之間的微妙關系?

十幾年前門戶崛起時,有匠心的編輯和有經驗的內容團隊無疑最重要。陳彤曾用一本《新浪之道》解構網絡新聞運作,其中舉例道,在“9.11”恐怖襲擊發生時,新浪網編輯在事件發生之際捕捉到最早的信息,事件發生9分鐘後發布了第一條新聞,並且將這條快訊放置在新浪首頁和新聞中心首頁重要位置,。這是中國大眾傳媒對“9.11事件”發出的第一條報道。

而現在的信息碎片化時代下,連門戶自己都已經被稱作“傳統媒體”,甚至連接 wifi 的 app、手機垃圾清理工具都塞滿"新聞"。伴隨著新聞熱點的多元化,海量的新聞內容來滿足讀者對資訊的閱讀需求,如果繼續單純依賴人工編輯,受到內容數目的限制,內容分發效率確實不高,而且,人工編輯往往集中於最熱門的頭部內容,往往“千人一面”,更長尾的內容則很難再有精力覆蓋。

機器算法正好擅長這些難題,一方面,它通過采集海量的信息,然後通過數據挖掘,智能分析出每時每刻最熱門最值得用戶關註的資訊;另一方面,推薦引擎會根據用戶對用戶瀏覽、收藏、轉發、評論新聞資訊的行為不斷進行分析,再結合其閱讀喜好、習慣、閱讀時間、閱讀位置等多個維度,建立起個人用戶模型,兩者結合後,智能地為用戶推薦越來越精準的個性化信息。當你使用次數越多,針對你的個性化資訊推薦就變得越準確。

簡單來說,就是把搜索與推薦的技術優勢最大化地嫁接在新聞客戶端上,通過上億級別的因素組合來挖掘、分析數據,尋找各種規律間的聯系,分析用戶興趣並推送其所需信息。

因此,在張一鳴眼里,今日頭條不是做新聞,而是做信息的獲取,做法思路和過去完全不一樣,現在完全是從滿足用戶需求的角度,而不是取決於主編的才華。

可以看到的是,基於海量數據的機器學習算法無疑令分發效率顯著提高。但與此同時,算法提供的內容對用戶的價值是否也有相應的提升?

特別是,如果一味依賴話題數據指標和話題相關性的算法分發,由於讀者獵奇心或是出於心理最微妙的興趣使然,追求槽點和趣點的聲音占據了大多數,這就讓信息趨於片面。輿論“狂歡”的背後,隨之而來的可能就是標題黨、涉黃新聞、無營養的雞湯文大、聳人聽聞的低劣內容等大行其道。

 

舉個簡單的例子,出於當你在頭條點擊一條“原配暴打小三”或是某類犯罪新聞,系統根據你的瀏覽記錄,每天自動為你源源不斷地推送相似單一的內容。而這正是因為“聰明的算法”。

這也是外界對於頭條類個性化推薦新聞App的批評之一:你不能用算法一味迎合讀者的低級趣味。

正如鳳凰網CEO劉爽所言,“海量讀者因為非常聳動的標題被吸引過去,看了以後立刻走人,雖然他個人的體驗很不愉快,但他點擊這個行為留下來了,被算法捕捉到,所以形成了惡性循環,越多的人被吸引,它也會給這個新聞更多的權重,所以會推薦開去,這嚴重影響了閱讀的體驗。”

除了可能把大眾閱讀的口味引向低俗化,另一個可能隨之而來的問題還有,如果一味迎合用戶興趣,“千人千面”的個性化浪潮是否會形成信息孤島,從而擠壓掉他們真正感興趣或者培養新興趣話題的生存空間,他們感知新事物的機會越來越少。?

美國芝加哥大學教授凱斯•桑斯坦曾在《網絡共和國》討論過類似的情形:為每個讀者量身定制的“個人日報”式的信息選擇行為,會導致網絡繭房的形成。當個人長期禁錮在自己所建構的信息繭房中,久而久之,個人生活呈現出一種定式化、程序化。長期處於過度的自主選擇,沈浸在個人日報的滿足中,失去了解不同事物的能力和接觸機會,不知不覺間為自己制造了一個“信息繭房”。

而且,至少目前來看,機器的算法還不是萬能的。

此前,Facebook曾把其推薦最熱內容的“趨勢話題(Trending Topic)”撤掉人工編輯,改為全部機器算法執行, 希望由此降低主觀因素對推薦內容的影響,結果不過還不到 3 天,完全依靠演算法篩選熱門新聞的趨勢話題,讓一則關於美國大眾新聞主播梅根•凱利(Megyn Kelly)的假新聞登上版面,更導致一張普利策獲獎照片被算法認定是情色圖片直接刪除而成功激起民憤。

對於人工編輯而言,要想避免這些錯誤非常容易,但 Facebook 篩選趨勢話題的演算法依賴於這一話題相關文章和貼文數量,相對來說較容易讓假消息、騙點擊標題的新聞登上版面。

從趨勢來看,未來算法技術必定走向人工智能化,依靠它們能夠解決的事情包括對用戶畫像、洞察的判斷……但在技術背後,如何註入人文情懷?至少優秀內容人的直覺、經驗和匠心仍然不能被替代。

PermaLink: https://articles.zkiz.com/?id=231809

Next Page

ZKIZ Archives @ 2019