📖 ZKIZ Archives


第一財經發布“DT稿王”:寫稿機器人的“尖子生”

來源: http://www.yicai.com/news/5020955.html

自去年開始,陸續就有如“快筆小新”、“Dreamwriter”等機器人開始參與寫稿工作。智能機器人開始介入了只有人類才能勝任的“資訊處理及生產”工作,種種科幻片里的情節突然在人們面前成為了現實。然而,目前的機器人寫稿,只能代替撰寫新聞資訊中標準化的消息、快訊等。

在5月30日-5月31日舉行的2016第一財經技術與創新大會上,“DT稿王”這一新一代的智能寫稿機器人開始“任職”了。

第一財經發布“DT稿王”

“DT稿王”是阿里巴巴戰略入股第一財經後,雙方共同醞釀、聯合推出的一款在DT(數據技術)時代幫助財經記者快速及時寫稿的智能寫稿系統,用機器代替人完成實時監控信息源,利用文本解析和信息抽取技術實現自動信息抽取,采用機器學習算法並融合第一財經編輯記者團隊的經驗、智慧,以模板和規則知識庫的方式根據實時抽取的信息做出判斷,輸出相應的模板及規則知識庫內容從而產生新聞,以此應對海量、高速、多樣的大數據產生的信息。這種具有學習能力的智能系統加上人腦創造力的輔助,使得“DT稿王”成為寫稿機器人中的“尖子生”。

“DT稿王”究竟是如何一步步成為寫稿機器人的“尖子生”的呢?在第一財經技術與創新大會上,第一財經CEO周健工與第一財經首席數據科學家湯開智博士的對話,為我們揭開了未來的一幕。

“DT稿王”必然會發生的未來

隨著互聯網的高速發展,相對於三大傳播媒體即報紙、廣播、電視,網絡對於信息的傳播扮演越來越重要的角色。網絡信息傳播有著及時、高速和表現形式多元化的優勢。越來越多的個人和機構選擇把第一手信息通過網絡發布。

第一財經CEO周健工(右一)與第一財經首席數據科學家湯開智博士(左一)

第一財經CEO周健工說道:“我入行做記者的時候,我需要花費大量的時間去翻閱報告來獲取信息。有了互聯網之後,新聞從業者有了更強大的檢索能力。然而隨著信息技術的高速發展,商業世界的信息量也呈指數級爆發。中國的金融市場平均每天發布1900篇公告,每一天都堪比一次超新星的爆發,這1900篇公告,一位資深的證券編輯需要100個小時才能看完。在這樣的信息海洋中,媒體發展最大的瓶頸在於優秀的編輯記者在繁重的重複勞動中,失去了創造深度分析報道的時間機會,也錯過了為讀者提供更好決策依據的可能。所以我一直有這麽個願望,用技術來推動媒體的變革,為讀者提供更好的決策依據。”

因此,如何實時監控多樣化的信息源,如何及時有效地捕捉並報道信息源的瞬時變化,如何能有效全面地報道批量並發的信息已經成為現有的靠人工刷屏獲取信息並進行內容生產的巨大挑戰。除此之外,在海量、高速、多樣、真偽難辨(4v)的信息環境下,及時通過比對歷史信息、挖掘重要信息也成為當今記者、編輯的挑戰。“DT稿王”由此誕生,也成為了必然會發生的未來。

第一財經CEO周健工

當下發生的未來“多、快、好”

“DT稿王”的“任職”使未來在當下發生,其“多、快、好”的三項特性,是“DT稿王”成為目前寫稿機器人“尖子生”的主要原因。

“多”方面,“DT稿王”通過海量抓取、海量分析,主要針對上市公司公告、財務報表、官方發布、社交平臺、證券行情等信息源,日閱讀3000萬字,30天可寫完一部四庫全書。

“快”方面,“DT稿王”利用多臺服務器分布式的對發布的公告進行掃描,可以即時對公告進行分類篩選出待寫新聞稿的公告,並通過後臺的信息提取算法提取出該公告的重要信息,機器寫稿平均閱讀 7,471字/秒 = 448,275字/分鐘,是普通人閱讀速度的50倍。然後,按新聞稿成稿格式重新組織輸出,機器寫稿為28字/秒 = 1,680字/分鐘,普通人打字的35倍。

“好”方面,“DT稿王”生成的稿件語句流利通順,完全符合人類自然語言的語法。解決了目前機器人寫稿的最大問題,即語句不通順不流暢。而且“DT稿王”在海量的信息中抓住重點信息本身的重點,協助決策的快速實施。如東旭光電科技股份有限公司5月14日所發布的公告為例,全文2,274個字,總結成113字的核心內容和23字的標題,同時不是盲目地抓取公告中的大標題。

第一財經首席數據科學家湯開智博士

“DT稿王”的未來——技術與應用的叠代

據第一財經首席數據科學家湯開智博士介紹,目前“DT稿王”產品只走完了第一步,但是建立了一個可以不斷延展的稿件生成系統。在隨後的2.0和3.0的產品叠代中,將越來越多地解決各種商業化寫作過程中的痛點,讓產品越來越成為各種作者喜歡的工具。

“DT稿王”將在財經領域繼續深耕,發揮一財豐富的財經報道經驗,給一財提供更加快速,個性化,越來越有深度的稿件。第一財經與阿里巴巴共同成立的媒體實驗室已經和華奧星空形成了合作策略,將開展實時體育賽事報道的深度合作。隨著“DT稿王”產品的成熟,將使用機器人來完成其它商業化的規範寫作領域的稿件。

而技術方面的叠代,將不斷引進先進的人工智能和大數據的技術到寫作領域中,不但大力推進媒體轉型過程中技術的力量,而且也可以通過解決寫作場景的複雜性問題,推動人工智能技術的發展。

“DT稿王”帶來的智能寫作技術,必會顛覆媒體的生產方式。這種顛覆,將驅使媒體進入智能時代,與正在興起的智能制造和物聯網技術一起,變革整個信息的流通邏輯,變革人類對信息的理解。而第一財經作為國內領先的財經資訊全媒體平臺,有義務與業內同仁一起使“未來”在當下發生。

PermaLink: https://articles.zkiz.com/?id=199553

Next Page

ZKIZ Archives @ 2019