ZKIZ Archives


中環在線:陳啓宗寫稿從未遲交 李華華

2008-11-10  AppleDaily

恒 隆地產(101)主席陳啓宗向以言詞尖銳見稱,每年恒隆年報上嘅主席報告書,都係由佢親自執筆。佢talk得又寫得,講嘢不時有精警名句,不過華華聽聞, 朗尼(陳啓宗洋名Ronnie)幾忙都好,即使工作排到密不透風,應該唔得閒寫稿,都會準時喺deadline交稿,未試過遲稿。

篇幅一年比一年長

主 席報告書係中英對照,聽恒隆中人講,朗尼陳通常寫英文,中文就交由同事繙譯。不過,華華擔心嘅係朗尼一時寫得興起,停唔到筆咁點呢?恒隆嘅主席報告十足萬 言書,07年度嘅年報就長14頁,08年度年報更長18頁,會唔會超出預算呢?原來負責嘅同事好醒目,預多咗空間畀老闆,你估朗尼係華華呢啲small potatoes咩,寫長咗嘅稿要俾人刪,貴為集團主席,邊個敢郁佢篇稿。華華聽聞,負責嘅恒隆職員,收到老闆嘅萬言主席報告之後,既唔改得又唔刪得,有 幾長就要落幾長。咁,如果老闆寫錯字又改唔改得呢呵?今年恒隆仲將老闆過去十年嘅主席的話,編成一本60幾頁《十年主席報告》,送畀股東睇o忝。

陳啓宗過去數年在主席報告書內金句

08年度

‧市道好時吾等不會擠壓租戶一分一毫作租金,市道壞時吾等亦不會反目無情……亦無意恃強欺壓良好租戶。

‧(內地)負責經濟事宜之政府高級官員看來非常能幹,但他們未曾經歷重大之市場波動……

07年度

‧應當注意,本人在亞洲曾多次目睹有發展商於贊助某些國際商業雜誌舉辦的研討會後,隨即獲該等雜誌頒予此獎彼獎。吾等認為該等行為實乃弄虛作假,故拒絕參與其中。

‧要戰無不勝乃不切實際,但運氣偶爾會垂青辛勤之輩,而吾等確實非常辛勤!

06年度

‧許多發展商喜歡合同措詞含糊,好讓他們日後佔甜頭。他們忘記對方是擁有最終決定權的政府。

‧購物商場是我們在內地的主要產品,故在某程度上,我們可被視為消費股而非一家純地產公司。地產是一項工具,可藉此受惠於增長迅速的中國消費……

李華華
PermaLink: https://articles.zkiz.com/?id=3148

第一財經發布“DT稿王”:寫稿機器人的“尖子生”

來源: http://www.yicai.com/news/5020955.html

自去年開始,陸續就有如“快筆小新”、“Dreamwriter”等機器人開始參與寫稿工作。智能機器人開始介入了只有人類才能勝任的“資訊處理及生產”工作,種種科幻片里的情節突然在人們面前成為了現實。然而,目前的機器人寫稿,只能代替撰寫新聞資訊中標準化的消息、快訊等。

在5月30日-5月31日舉行的2016第一財經技術與創新大會上,“DT稿王”這一新一代的智能寫稿機器人開始“任職”了。

第一財經發布“DT稿王”

“DT稿王”是阿里巴巴戰略入股第一財經後,雙方共同醞釀、聯合推出的一款在DT(數據技術)時代幫助財經記者快速及時寫稿的智能寫稿系統,用機器代替人完成實時監控信息源,利用文本解析和信息抽取技術實現自動信息抽取,采用機器學習算法並融合第一財經編輯記者團隊的經驗、智慧,以模板和規則知識庫的方式根據實時抽取的信息做出判斷,輸出相應的模板及規則知識庫內容從而產生新聞,以此應對海量、高速、多樣的大數據產生的信息。這種具有學習能力的智能系統加上人腦創造力的輔助,使得“DT稿王”成為寫稿機器人中的“尖子生”。

“DT稿王”究竟是如何一步步成為寫稿機器人的“尖子生”的呢?在第一財經技術與創新大會上,第一財經CEO周健工與第一財經首席數據科學家湯開智博士的對話,為我們揭開了未來的一幕。

“DT稿王”必然會發生的未來

隨著互聯網的高速發展,相對於三大傳播媒體即報紙、廣播、電視,網絡對於信息的傳播扮演越來越重要的角色。網絡信息傳播有著及時、高速和表現形式多元化的優勢。越來越多的個人和機構選擇把第一手信息通過網絡發布。

第一財經CEO周健工(右一)與第一財經首席數據科學家湯開智博士(左一)

第一財經CEO周健工說道:“我入行做記者的時候,我需要花費大量的時間去翻閱報告來獲取信息。有了互聯網之後,新聞從業者有了更強大的檢索能力。然而隨著信息技術的高速發展,商業世界的信息量也呈指數級爆發。中國的金融市場平均每天發布1900篇公告,每一天都堪比一次超新星的爆發,這1900篇公告,一位資深的證券編輯需要100個小時才能看完。在這樣的信息海洋中,媒體發展最大的瓶頸在於優秀的編輯記者在繁重的重複勞動中,失去了創造深度分析報道的時間機會,也錯過了為讀者提供更好決策依據的可能。所以我一直有這麽個願望,用技術來推動媒體的變革,為讀者提供更好的決策依據。”

因此,如何實時監控多樣化的信息源,如何及時有效地捕捉並報道信息源的瞬時變化,如何能有效全面地報道批量並發的信息已經成為現有的靠人工刷屏獲取信息並進行內容生產的巨大挑戰。除此之外,在海量、高速、多樣、真偽難辨(4v)的信息環境下,及時通過比對歷史信息、挖掘重要信息也成為當今記者、編輯的挑戰。“DT稿王”由此誕生,也成為了必然會發生的未來。

第一財經CEO周健工

當下發生的未來“多、快、好”

“DT稿王”的“任職”使未來在當下發生,其“多、快、好”的三項特性,是“DT稿王”成為目前寫稿機器人“尖子生”的主要原因。

“多”方面,“DT稿王”通過海量抓取、海量分析,主要針對上市公司公告、財務報表、官方發布、社交平臺、證券行情等信息源,日閱讀3000萬字,30天可寫完一部四庫全書。

“快”方面,“DT稿王”利用多臺服務器分布式的對發布的公告進行掃描,可以即時對公告進行分類篩選出待寫新聞稿的公告,並通過後臺的信息提取算法提取出該公告的重要信息,機器寫稿平均閱讀 7,471字/秒 = 448,275字/分鐘,是普通人閱讀速度的50倍。然後,按新聞稿成稿格式重新組織輸出,機器寫稿為28字/秒 = 1,680字/分鐘,普通人打字的35倍。

“好”方面,“DT稿王”生成的稿件語句流利通順,完全符合人類自然語言的語法。解決了目前機器人寫稿的最大問題,即語句不通順不流暢。而且“DT稿王”在海量的信息中抓住重點信息本身的重點,協助決策的快速實施。如東旭光電科技股份有限公司5月14日所發布的公告為例,全文2,274個字,總結成113字的核心內容和23字的標題,同時不是盲目地抓取公告中的大標題。

第一財經首席數據科學家湯開智博士

“DT稿王”的未來——技術與應用的叠代

據第一財經首席數據科學家湯開智博士介紹,目前“DT稿王”產品只走完了第一步,但是建立了一個可以不斷延展的稿件生成系統。在隨後的2.0和3.0的產品叠代中,將越來越多地解決各種商業化寫作過程中的痛點,讓產品越來越成為各種作者喜歡的工具。

“DT稿王”將在財經領域繼續深耕,發揮一財豐富的財經報道經驗,給一財提供更加快速,個性化,越來越有深度的稿件。第一財經與阿里巴巴共同成立的媒體實驗室已經和華奧星空形成了合作策略,將開展實時體育賽事報道的深度合作。隨著“DT稿王”產品的成熟,將使用機器人來完成其它商業化的規範寫作領域的稿件。

而技術方面的叠代,將不斷引進先進的人工智能和大數據的技術到寫作領域中,不但大力推進媒體轉型過程中技術的力量,而且也可以通過解決寫作場景的複雜性問題,推動人工智能技術的發展。

“DT稿王”帶來的智能寫作技術,必會顛覆媒體的生產方式。這種顛覆,將驅使媒體進入智能時代,與正在興起的智能制造和物聯網技術一起,變革整個信息的流通邏輯,變革人類對信息的理解。而第一財經作為國內領先的財經資訊全媒體平臺,有義務與業內同仁一起使“未來”在當下發生。

PermaLink: https://articles.zkiz.com/?id=199553

5個人2年時間 騰訊寫稿機器人寫得怎麽樣了?

2015年9月10日,一條標題為《8月CPI漲2% 創12個月新高》的新聞在騰訊財經上發布。看上去,這條新聞的內容和媒體記者日常的消息稿無異,引用了統計局的數據,還加入了國家統計局城市司高級統計師余秋梅以及銀河證券等分析師對數據的分析和預測。但它背後的作者,其實是騰訊財經開發的寫稿機器人DreamWriter。

“機器人來搶記者飯碗了!”、“記者們已哭暈”……寫稿機器人一時間引發業內熱議。

“根據算法在第一時間自動生成稿件,瞬時輸出分析和研判,一分鐘內將重要資訊和解讀送達用戶。”當時騰訊這樣描述自家的寫稿機器人。

距離寫稿機器人DreamWriter發出的第一篇新聞已有一年半的時間,媒體中陸續已有如第一財經“DT 稿王”、新華社“快筆小新”等機器人開始參與寫稿工作。

DreamWriter項目副總監劉康對包括第一財經在內的媒體透露,目前DreamWriter在財經+科技應用的發稿量超過2000篇/天,體育稿量500篇/天,包括每天行情報盤、上市公司公告精要報道,以及體育賽事每輪每場的消息。

不僅如此,第一財經記者了解,基於寫稿機器人,騰訊內部一款集合了新聞資訊類 AI和超級資訊服務秘書類的應用正在研發當中。

機器人這樣“寫稿”

之所以開發一款寫稿機器人,源自騰訊自己的“痛點”。

劉康對第一財經記者回憶,當時他所在的騰訊財經頻道招了一批新人和實習生,大量的基礎工作、快速的稿件、財報、宏觀數據變動、板塊變動都需要快稿,這對新人來說既枯燥也辛苦。“所以大家都在問能不能讓機器來做,這樣的話,我們富有創造力的新人可以把自己的精力留下來,做更有創造力的事情,這是我們做這件事情的起點。”

於是,從2014年12月開始籌劃並建立數據庫,到2015年3月正式啟動機器人寫作項目,經過開發和測試約半年後,騰訊寫稿機器人Dream Writer於2015年9月正式上線。

劉康告訴第一財經記者,事實上DreamWriter的團隊僅有五個人,不過多個騰訊部門均被卷入DreamWriter工作中,參與搭建和底層支持。

在過去一年半的時間里,這支團隊一直在低調運作。劉康告訴記者,DreamWriter一直在持續工作,尤其在奧運會期間, DreamWriter產出內容達3600余篇,其中第一塊金牌的新聞就是機器人寫的。

寫稿機器人DreamWriter,究竟是如何寫出一篇新聞稿件的?

劉康表示,從文本的角度,機器寫作實現從0到1,是相對簡單的,例如,用技術團隊簡單做一個財報系統,或是給體育賽事做一個基本的描述這類模塊化的寫作,但是如何從1到3, 讓機器人的稿子寫得有“人情味兒”、對細節描述更加到位和精彩,花費了相當多的精力。

以寫跳水新聞為例,這是一個評分制的比賽,評委對於走板、空中姿態、落水姿態、水花等等每個動作的打分,都有詳實的數據被記錄在數據庫里。接下來,這些數據會被騰訊通過一定的算法和機器自己的識別——先讓機器跑幾十萬篇的數據,跑一個規則出來,它會自己把這些數據重新還原。因為每一個分數都可以還原成一個動作,這樣通過一定的算法把它還原成原先的場面就變得可行。

劉康提到,其實競爭對手也有很聰明的寫稿機器人,不過對方的做法是抓直播間的描述,通過一定的算法和邏輯拼接成一篇文章,而騰訊寫稿機器人DreamWriter不一樣,是基於特別細顆粒化的數據進行還原。

“今天數據量非常細,細到可以描述到每一個數據的顆粒還原。”劉康說,“比如足球的一個動作怎麽記進數據庫里面,射門包括射偏、打中立柱、高出立柱……這些都可以用數據還原。 ”

而在寫稿機器人背後的核心技術,主要涉及的有包括智能撰文技術、內容抽取技術、要聞萃取技術這三項。目前騰訊已經獲得相關專利。

以內容抽取的技術為例,Dream Writer可以把一篇千字文章概括為數百字,其中涉及到統計學、深度學習等技術。在財經領域,寫稿機器人更依賴統計學,但在其他內容領域,騰訊可能需要單獨研發一款算法產品模型。

此外,針對寫稿機器人所寫的稿件,騰訊成立了一個專門的安全管理平臺進行內容風險管控:第一輪,機器寫作時會單獨做一個算法和規則判斷機器寫的有沒有問題;第二輪是經過安全審核;第三輪才能正式推出來。這中間銜接時間越少,意味著出來的作品既準確又迅速。

做一款和頭條相反的產品

劉康對記者透露,目前DreamWriter在財經、科技、體育等領域的常規撰文、批量撰文已經開發完成,這款寫稿機器人未來一年甚至更長的時間的工作重點,主要在於持續進行優化文本,並且將內容生產領域從目前的科技、財經和體育擴充到全品類,並不急於考慮商業化。

例如,在財經領域新聞的寫作上,盡管目前寫稿機器人本身具備強算法規則和模型,但難度也不小,特別是對數據的解讀和認知,甚至將來的預測。劉康坦言,如果希望DreamWriter寫得更深度,甚至將來要寫行業研報、寫一些垂直類深入的研究,目前仍需要再花時間深耕 。

在劉康看來,寫稿機器人不會搶走記者的飯碗,而是希望DreamWriter能夠解放記者,讓記者從事更具挑戰和智慧的工作。“遠遠談不上取代(記者),我希望它始終是個助手,幫我整理資料,然後我來賦予它生命。”

接下來,DreamWriter團隊希望推出一款集合新聞資訊類 AI和超級資訊服務秘書類的App。

從第一財經記者的體驗來看,這款代號為"DreamReader"的App 聽讀兼備,集成了語音交互和文字閱讀的功能,所有內容來自 DreamWriter撰寫實時要聞簡報和要聞精華。

和今日頭條、天天快報等正在“殺死”用戶越來越多時間的新聞類 App 不同,劉康稱希望給這款App“做減法”,充當“助手”的角色,給用戶提供重要且簡潔的新聞,讓用戶“用完即走”。

他提到一款關於實時快消息的國外App,“我幾乎沒有打開過它,只是它會推送到通知中心,我掃一眼就大概知道了,從DAU來講它沒有多少,因為我沒有打開過它,時長更沒有了,但是它對我是有用的,對我有幫助。我們也一樣,希望不用這些標準,只要它能幫助到你,我們認為它就是一個好產品。”

除了提供個性化的資訊,騰訊還希望DreamRead延伸成為一個集合了天氣、汽車、娛樂、科技、重大政策、資產管理等等眾多場景在內的服務平臺。“比如說可以推送一下最近我買的股票怎麽樣、投資基金虧了多少錢;再如最新的房地產政策,比如我買了一套學區房,它會提醒你,最近房地產政策頻出,你要關註一下你的資產安全。”

不過眼下,這款圍繞個性化資訊生產和服務的 App的還需時間打磨,劉康稱,目前還沒有確定上線時間表,也不排除會對產品架構進行大幅修改。

PermaLink: https://articles.zkiz.com/?id=245866

谷歌投資寫稿機器人,記者要被機器“搶走飯碗”?

來源: http://www.iheima.com/zixun/2017/0718/164191.shtml

谷歌投資寫稿機器人,記者要被機器“搶走飯碗”?
吳懟懟吳懟懟

谷歌投資寫稿機器人,記者要被機器“搶走飯碗”?

人類精神必須淩駕技術之上。

來源 | 吳懟懟 (ID:esnql520)

作者 | 吳懟懟

近日,科技巨頭谷歌投資了英國新聞機構報業協會(Press Association),用以支持開發自動化新聞編寫軟件。按計劃,該軟件每月能夠編寫多達3萬條本地新聞,這意味著新聞行業的記者和編輯們不得不和機器“搶飯碗”,在日益強大的技術面前,記者們真的要失業了嗎?

5

此前,騰訊新聞機器人Dreamwriter、南方都市報社寫稿機器人“小南”已經應用到財經和民生報道中,以人工智能和互聯網為代表的新技術正在提升新聞行業整體效率。然而即使是有機器寫稿輔助,大量實時、深度新聞的撰稿、編輯工作仍需要專業的編輯記者完成。寫稿機器人大多用於含有海量數據的,不需要核查、或者進一步調查的內容,機器並不能替代人,人機結合才能使將雙方優勢最大化。

人機各有邊界,都有不可取代的作用

77

寫稿機器人的出現讓新聞生產得以突破人類體能的限制,變得更加高效。人工智能技術在新聞領域的廣泛應用得益於它的數據處理、語義識別、繼續學習等理解和處理能力。通過大量數據的學習,人工智能能夠模仿甚至理解相對固定的新聞寫作方式,並依靠算法迅速篩選、整合出內容;同時,算法技術通過對用戶點擊、閱讀等行為的追蹤和分析,能夠描繪用戶的偏好畫像,迅速將內容推送給感興趣的用戶。

目前,谷歌、臉書、騰訊、阿里等國內外巨頭都在大力發展人工智能技術。美聯社早在2014年,便開始使用自動化軟件生成商業公司季度財報的報道,得益於機器報道工具的協助,現在每個季度能夠快速發布數以千計的季度財報報道。

先進技術帶來了編寫海量報道的能力,但同時人的作用依然不可忽視。正如北京外國語大學國際新聞與傳播學院教授展江所說,人工智能或許更擅長在體育賽事這類媒介事件中抓取數據生成報道,但從全球範圍來看,國際知名媒體在面對突發的新聞事件時,特別是災難性事件時,記者仍需在場。

在新聞資訊平臺,算法技術同樣不能脫離人的掌控。目前的機器算法在很大程度上依賴內容的互動量和分享率作為數據處理依據,並不能深入理解新聞內容,高互動和分享率並不與新聞質量掛鉤,因此不設編輯的純算法推薦,更容易讓低俗內容、標題黨和不當內容受到廣泛傳播。

另一方面,寫稿機器在內容生產上缺乏人的主觀性而帶來的“人情味”和百花齊放,使得內容產出更加單一,更加枯燥和同質化,難以形成風格。同時在內容接收上,基於流量和利益誘導,曲意迎合用戶的算法推薦給用戶的只能是越來越同質化、越來越無價值的內容,讓用戶陷入“信息繭房”中,日益背離技術讓人獲得更豐富信息的初衷。

海量的、機械的、無需核實、無需風格的工作交給計算能力遠超人腦的計算機無疑是更明智、高效的選擇。而人在新聞多樣性、風格化和把關者角色的作用也不能被機器替代,大量實時、深度新聞的撰稿,編輯工作仍需要專業的編輯、記者完成。

技術是把雙刃劍,人機結合才能運用自如

9

對於先進技術和人的關系,著名科學家霍金對人工智能的思考值得參考,霍金警告道,AI是一把雙刃劍,人工智能一旦脫離人的束縛,會給人類帶來巨大災難,人必須制造出可控的人工智能。人民日報也在近期發表的社評中指出,“不能做堂·吉訶德,對算法和技術視而不見,拒絕時代進步的大潮;也不能一味依賴,反而成為算法和技術的奴隸。”技術是把雙刃劍,人機結合才是新聞領域的發展趨勢。

實際上,谷歌在支持技術研發的同時,也越來越重視人在其中的作用。英國新聞機構報業協會的主編皮特·科林福敦表示,寫稿機器人生產新聞的過程並不是完全依靠所謂的機器人記者完成,經驗豐富的人類記者仍然是整個過程的重要組成部分。在體察人情和獨立思考、獨到見解上,人類毫無疑問比機器更有“人情味”,更加靈活。

以一點資訊為代表的新聞客戶端用人機結合重新闡釋了技術和人的關系。平臺主張機器算法+人工編輯的新聞分發模式,以技術驅動為基礎,輔以人工幹預。編輯隊伍配合機器算法不斷訓練,提升算法對內容分辨的精準度,同時用機器強大的數據處理能力來輔助編輯,將人和機器的優勢部分有機融合,補足機器分發的盲目性和人力處理海量內容的局限性。將合適的內容精準推送到感興趣的用戶面前。

對於人工與機器在新聞領域的作用及關系,一點資訊總裁陳彤曾指出:人工智能會給新聞操作方式帶來一些改變,但編輯的作用更大。我們可以借助人工智能,但不能完全放棄人的編輯理念,放棄對用戶體驗的洞察而完全依靠算法,否則就會出現觀點狹隘、標題黨等問題。

0

在人工智能大行其道的時代,更要堅信人的價值。最後,引用愛因斯坦的一句話作為結束語:人類精神必須淩駕技術之上。

寫稿機器人記者人類精神
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=254827

機器人寫稿時代來了!今日頭條、騰訊、南周齊發力,媒體人將迎下崗潮?

來源: http://www.iheima.com/zixun/2017/0719/164208.shtml

機器人寫稿時代來了!今日頭條、騰訊、南周齊發力,媒體人將迎下崗潮?
品途商業評論品途商業評論

機器人寫稿時代來了!今日頭條、騰訊、南周齊發力,媒體人將迎下崗潮?

如果說工業革命是逐漸取代了藍領體力勞動者,那麽人工智能革命則將要取代部分白領腦力勞動者。

來源 | 品途商業評論 (ID:pintu360)

作者 | 尹天琪

“不僅僅是重複性的工作會被取代,很多白領工作也將在10年內被取代,包括記者(媒體人)這個行業。”這不是聳人聽聞,這是李開複博士在新書《人工智能》分享會上的一段警世之言。

“AI 作者已經虎視眈眈,很難想象靠文字為生的的人忽然有一天不能靠文字養活自己,那麽我們該去做什麽?”這已經不是李開複博士第一次在公開演講中這樣說了。

45.webp

類似的言論越來越密集,這喚起了很多寫作者的焦慮,包括筆者自己。如今,中國由微信、今日頭條等媒體分發平臺造就的自媒體人數以百萬計,回想前兩年一個公號可以炒到幾千萬甚至上億的光景,如今的自媒體行業已經不那麽好做。激烈的競爭、有限的爆料和新聞的嚴控導致自媒體正在面臨洗牌。然而比洗牌更可怕的將是群體性失業!

李開複博士的話不是為了嚇唬媒體人,因為AI寫作機器人已經在多家國內外媒實實在在的體落地了。

並且它們在不眠不休的練習寫作……

機器人上崗寫稿

李開複說,“如今美國第一大通訊社——美聯社的大多數稿件已經由人工智能完成。”品途商業評論了解到,美聯社通過與提供自動化寫作服務的公司AutomatedInsights合作,讓機器人讀取財報,然後按照編輯預先設定的框架,自動生成偏向於數據分析的財經新聞,根據實際比較,語言大師撰寫文章的差錯率甚至比資深記者還要低。

谷歌最近也成立了數字新聞基金,並撥款超過80萬美元投資了一家名為PressAssociation(PA)媒體公司的機器人撰稿項目,該項目將用來支持英國和愛爾蘭的新聞業。在AI的幫助下,媒體公司PA每月生產將近3萬個地方新聞。

AI記者始於2009年,在美國的職業棒球大聯盟季後賽上,一款名為StatsMonkey的人工軟件超過人類記者的速度,率先完成一篇機器稿件,當時在街頭巷尾爭議四起。隨後的兩年,包括《福布斯》、洛杉磯時報(LosAngelesTimes)在內的國外知名媒體逐漸開始嘗試用機器人寫稿。

目前,AI完成的文章已經應用在商業,政治等領域。依靠強大的數據平臺,AI以數秒之內就可以生成一篇稿件,速度無人能及。

今日頭條的AI寫稿嘗試

46.webp

去年的里約奧運會上,今日頭條研發的一款機器人——xiaomingbot通過實時撰寫新聞稿件,以跟電視直播幾乎同時的速度發布報道。

奧運會16天中,Xiaomingbot為今日頭條共生產了450多篇奧運新聞稿,閱讀數總計超過百萬。

Xiaomingbot生產的內容涵蓋了所有體育新聞的重要信息,包括比賽時間、比賽名稱、體育館名稱、規則、運動員姓名、國籍和年齡等。同時它還可以根據新聞人物添加不同的配圖。據統計,其文章閱讀率與同期職業體育記者撰寫新聞的閱讀率相同。

品途商業評論了解到,他們的「寫稿」模塊是由頭條人工智能實驗室與北京大學計算所(萬小軍團隊)聯合研發而成。這是國內第一款可以報道奧運賽事的人工智能機器人,在結合了最新的自然語言處理、機器學習和視覺圖像處理的技術之後,通過語法合成與排序學習生成新聞。

47.webp

在內容生產方面,Xiaomingbot從文本生成、潤色完成報道至發布推送到手機客戶端,可以在2秒之內自動完成。此前,大部分步驟是通過人工實現的。

雖然奧運會已經結束一年多,但Xiaomingbot作為光明網供稿作者,仍在繼續生產新聞報道,內容包括歐洲頂級足球聯賽,NBA賽況與每日球賽總結,CBA比賽播報,中超比賽播報等。

今日頭條透露,截至2017年5月底,xiaomingbot自動撰寫與發布新聞共計5139篇,包括長篇新聞420篇,總計閱讀量超過1800萬次。 

紙媒的AI嘗試

“根據12306網站余票信息,截至2017年1月17日20:00:18,1月20日從廣州出發至多個熱門目的地的路線中,廣州到北京、洛陽、南昌、貴陽的火車票全部賣完,想要去這些地方的朋友只有另謀他法了。

廣州到大連、鄭州、青島、上海、南京、南寧的票比較緊張,都不足100張。其中余票最少的是廣州到鄭州、上海、南寧,均只有1張,有需要的旅客趕緊動手啊……”

這篇春運報道曾於年初發表在南方都市報上,它出自機器人——“小南”之手,筆者把這篇稿件給從業多年的媒體人看,對方給本就分辨不出這是機器人還是人寫的。

在AI領域,傳統紙媒也不甘落後,南方都市報社、凱迪網絡和北京大學計算機科學技術研究所三方已經正式宣布聯合成立“智媒體實驗室”,小南正是該實驗室的首個重要成果代表。

據技術團隊成員介紹,采集數據、分析數據、規劃文章結構,再到最終的遣詞用句,和人類一樣,機器人也能做到“讀書破萬卷,下筆如有神”。

海量的數據和高效的算法,是寫稿機器人的兩大利器。“小南”的首篇春運報道作品,共300余字,數據自動抓取完成後,報道的生成只用了不到一秒的時間。

既然寫稿機器人已經能夠如此神速流暢的編寫出一篇新聞稿件,那麽作為傳統媒介大佬的南方周末是否擔心自己人將面臨失業呢?

對於這個問題,“小南”研究團隊人員表示“暫時不需要擔心”。

目前,類似“小南”這樣的寫稿機器人還不具備真正的人類思維。“他”只能依據既有的數據和事先設定好的程序來寫稿,不能像人類一樣思考並提出自己的問題。質疑、追問、尋找對方話語中的新聞線索,諸如此類的人類記者的法寶,對小南來說還是太難了。

小南研發團隊表示,“機器人和人類各有所長,機器人擅長快速處理繁雜的數據,但還做不到邏輯推理和深度歸納分析。至少在短時間內,機器人無法取代人類。不過,技術在發展,以後的機器人會不會對人類記者造成更大的沖擊,還是未知。”

未知總給人不安全感和恐懼,但不要盲目恐懼,我們需要了解機器人的寫作原理。

AI的寫作原理在於,給它一個特定的數據庫,AI程序通過計算和篩選將信息進行重新排列組合,最終輸出新聞報道或瞬時輸出分析和研判。說的通俗點就是找一堆句子拼成一篇文章。盡管截至目前機器人只能撰寫消息類稿件,諸如深度、人物類題材還無法勝任,但因其屬於批量生產類型,每天可完成百篇稿件,在稿件數量上“完勝”人類記者,這體現了知識工作自動化發展的趨勢。

48

目前,很多國內外頂級新聞機構都在研發機器人“書寫文字”項目。業內人士預測,除了短新聞,未來如會計報表、法律司法文書等大量格式化文書化的內容,完全可以由機器人來操作。

如果說工業革命是逐漸取代了藍領體力勞動者,那麽人工智能革命則將要取代部分白領腦力勞動者。 

“失業之談”兩種觀點

關於“失業之談”,有兩種觀點。李開複博士很篤定的認為,大多數新聞寫作記者肯定面臨失業,而註重人與人面對面采訪的深度報道,以及需要收集大量證據的調查性報道卻不能被AI取代。

李開複的新書《人工智能》對於這部點有詳細分析:新聞撰稿有簡單和複雜之分。信息報道類的新聞撰稿,在很大程度上正在被人工智能的新聞寫作工具所取代。比如在體育類、天氣類、財經類的新聞報道中,人類記者通常所做的不過是簡單地組合事實,報告情況,並按照某些既定的格式完成文本寫作。這種工作不需要複雜的判斷,可以被機器取代。

但是,同樣是新聞類寫作,如果你所撰寫的是《紐約客》類型的深度評述文章,每篇文章都需要大量采訪為基礎,並在原始素材之上,發揮作者的歸納和推理能力,提煉出相對複雜的邏輯結構,設計出最適合主題的表述形式,這些工作,每一項所需要的思考時間,都遠遠不止5秒鐘。有能力為《紐約客》撰稿的記者,在未來很長一段時間內,根本不用擔心自己的工作會受到人工智能的威脅。”

然而,這樣的觀點背後隱藏一個事實:做深度評述文章的記者只是廣大媒體人中的一少部分,那麽另一部分編輯記者將不可避免的面臨失業。

49

但也有研究者認為,AI寫稿只能起到輔助作用,應用非常有限,代替人類還很遙遠。

騰訊對品途商業評論表示,以騰訊的AI寫作項目Dreamwriter為例,它雖然已經應用在了財經和體育的短報道上,但是進展緩慢,代替人類記者還為時尚早。

可見,目前生成性文章目前只能應用在部分領域,現在還不可工業化。” 

50.webp

另有研究者表示,“現在的AI就像一個個嚴重偏科的小孩,在某些方面極其擅長,但在某些方面又相當弱智,有些能力則是完全沒有。AI實際上很難超越人類。雖然,關於AI完成了作畫、作曲、寫作之類的新聞一直層出不窮,但這些新聞其實少有將AI的作品完全展示出來的,原因很簡單:它們大多數都太慘不忍睹了。”

翻閱AI寫作的相關報道不難發現兩個事實:

1、所有的AI作品的完成都或多或少得到了人類的指點;

2、人給的指點越少,AI的最終作品就越慘不忍睹。

“AI的特性決定了現在的寫作只能是照貓畫虎,AI就是數學。這句話概括了目前AI(包括深度學習、神經網絡等一系列AI)的工作流程:評估計算能力涉及到的所有的可能性,為這些可能性打分,然後選取分數最高的那一個,再增加結果更好的可能性在將來的計算中的權重。想要讓AI有一個相對好的表現,這其中的核心就是:算法需要經過大量的訓練、試錯,才能逐漸成型。”

另一個事實也證明沒有人類幫助AI寫作還很初級。去年一篇名為《計算機寫小說的那一天》獲得了日本微型小說獎。這算是目前AI寫作的最高水平了,但該小說整個寫作過程並非由人工智能獨立完成。首先它需要人工設置好男女主人公、登場人物、故事梗概等,之後計算機再依據事先準備好的大量詞句素材,選擇使用,組合詞匯,最終自動生成小說。

也就是說,在創作中,人工智能的作用占到20%,80%經過人類的編輯潤色。名古屋大學的佐藤理史教授指出,“很難說這到底是人寫的,還是電腦寫的。”

其實,在AI寫作過程中,人已經把寫出一篇小說需要的所有零件準備好了,就等AI把它們拼起來,有人質疑“這也算是AI寫的小說?”

創作是一種無中生有的過程,從0到1,創造出世界上本來不存在的東西。而AI現在能做的,不過是從1到N而已。你給AI再多次的訓練,它也只不過是更改一個個值對應的函數和概率,卻理解不了這些值背後的含義,更不用說從海量信息中挑選出有價值的信息來作為新作品的題材了。

後記

通過采訪和調查,筆者雖然發現目前的AI寫作還處於初級階段,但是它背後的潛力依然讓“靠寫字謀生”的筆者不能平靜。如今,業內都在討論AI的“奇點”,“奇點”可以理解為AI從目前的弱人工智能變成強人工智能。

李開複認為,從目前的弱人工智能到強人工智能(如同人類可以推理和解決問題的AI)需要漫長的時間,但是從強人工智能到超人工智能(超越人類的智慧意思)可能僅僅需要一天的時間。

雖然當下,寫作者還可以惴惴度日,但高枕無憂的寫作時代已經結束了。如果奇點真的來臨,作為寫作者的人的價值真的毫無存在必要了嗎?

雨果科幻文學獎獲得者,《北京折疊》作者郝景芳給出了她的思考:“在未來,工廠機器流水線留給機器人,人會以更加富有創造性的方式與流水線競爭。人的獨特性會體現出來:思考、創造、溝通、情感交流;人與人的依戀、歸屬感和協作精神;好奇、熱情、誌同道合的驅動力。”

人和機器人最大的差別不是計算能力和文字轉化,而是人的情感、道德內核以及對現實世界的觀察與思索。創造者的個性化思考才是文字作品的價值所在!

機器人寫稿人工智能革命媒體人
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=254906

AI已經在寫稿了,未來的內容產業,也將被“資訊機器人”占領嗎?| AI創新50

來源: http://www.iheima.com/zixun/2017/1113/165973.shtml

AI已經在寫稿了,未來的內容產業,也將被“資訊機器人”占領嗎?| AI創新50
黑智黑智

AI已經在寫稿了,未來的內容產業,也將被“資訊機器人”占領嗎?| AI創新50

未來智能的“資訊助手”是否將人類獲取和使用信息的習慣?

文 | 楊潔    編輯 | 黑智

人工智能大潮興起,改變的不止是圍棋,還有更多的行業也被置於風口浪尖,首當其沖的,就是傳媒業。

內容的處理和分發,已經成為人工智能瞄準的對象。今日頭條依靠內容推薦算法實現資訊的個性化閱讀;度秘的人工智能開始了球賽解說;寫稿機器人在多家媒體里已經成為工作團隊中的一員。

但這些還遠遠不夠。在這個海量信息爆發的移動互聯時代,用戶高效、精準地獲取優質內容;內容創造者可以方便、高效地生產和分發信息,將是一直持續下去且巨大的需求。

智搜科技就是想要在下一個AI時代,讓“智能資訊助手”得以實現。作為國內首提“資訊機器人”概念的創業公司,它推出了智能資訊機器人引擎Giiso,以及基於該引擎研發的資訊APP天機智訊。在今年,Giiso機器人商店面世,為客戶提供資訊、編輯、寫作等服務的API接口。

自2014年成立以來,智搜(giiso)已經在2015年獲得了金沙江創投500萬美元pre-A輪投資,並在2016年獲得力合集團參股投資。2017年3月,智搜(giiso)又獲得了民銀資本領投、金沙江創投跟投的A輪融資。

在物聯網時代,這些場景可能不只是存在於想象中:在企業和媒體機構中,主編帶領“機器”編輯在生產高質內容;而作為另一端接收信息的用戶,可以不需依賴查詢和推送,只要簡單地詢問,機器助手可以把你所有感興趣或需求的資料,持續為你播報和更新。

內容產業的“資訊助手”

在智搜(giiso)成立的2014年,人工智能技術還不為大多人所熟悉,在傳媒領域,門戶網站的采編方式仍然占據主流,今日頭條也僅僅成立了一年。

智搜(giiso)首提的“資訊機器人”,在當時也是個新鮮的概念。“很多人曾經向我們詢問它到底是幹什麽的。在很多人心目中,機器人應該是個人形的硬件才對。”智搜(giiso)創始人武文斌說,“而實際上,機器人並非一定是人形,也並非必須是硬件,它也有可能是虛擬的形象,以及軟件系統等。”

智搜(giiso)在成立的最初,主要也是提供智能語義分析技術,智搜(giiso)的早期客戶也往往將語音識別和智搜的語義技術結合,進行文本內容的加工。由此,武文斌和智搜(giiso)的另一位創始人鄭海濤,將智搜(giiso)的主要業務,放在了資訊智能處理技術和資訊機器人軟件開發上,利用智能語義算法識別技術、采用遞歸神經網絡積累建立大規模知識圖譜,以及大數據挖掘技術,進行智能資訊處理技術的研發。

智搜武文斌

智搜(giiso)創始人 武文斌

武文斌是位創業“老兵”了,在創辦智搜(giiso)之前,他還曾參與創辦過兩家公司:圖書B2B在線電商平臺廣州粵圖在線科技公司,以及國內最早的P2P企業之一Workslink,在TMT行業,已經有20多年的從業經驗。

鄭海濤是韓國首爾國立大學博士、清華大學計算機科學與技術專業副教授,也是深圳市智能語義挖掘技術工程實驗室主任,他同時也是智搜(giiso)的首席科學家,在公司的技術研發工作中擔任主導。

2014年,智搜(giiso)自主研發了Giiso資訊機器人引擎1.0版,隨後,天機智訊APP 1.0版面世。目前,智搜(giiso)已經推出了系列基於Giiso資訊機器人引擎的智能編輯機器人產品。

“智能語義分析和知識圖譜,是Giiso資訊機器人的核心技術。”武文斌告訴黑智。在數據挖掘、深度學習、自然語言理解等技術基礎上,智搜知識圖譜可以對全網信息進行分析和處理。基於此,智搜(giiso)的資訊機器人可以根據對用戶的語音和文字指令理解進行回答;依據用戶的使用特征不斷學習,從而追蹤和推薦用戶感興趣的內容;並對獲取的資訊信息進行數據分析。

目前在新聞傳媒領域,已經有了今日頭條、一點資訊等產品。但是在智搜(giiso)的構想中,資訊機器人並不同於新聞客戶端APP。“可以舉個簡單的還是門戶時代的例子,”武文斌說,“我們看新聞會去新聞聚合網站,而我們查詢資料則會使用搜索引擎。”

但是,資訊機器人和傳統搜索引擎的功能也仍然有所差異。傳統的搜索引擎根據用戶每次輸入的信息提供內容,只能記錄搜索歷史,卻無法提供連續性和個性化、預見性的推薦。而基於語義理解和數據挖掘能力,做到根據用戶的行為習慣特征,進行學習,篩選出相關資訊,這才是資訊機器人存在的價值。

換句話說,智搜(giiso)希望打造的,是用戶在信息獲取中的“資訊助手”,整合了信息的搜索、采集、編輯、處理、分析、推薦等各項能力。它可以直接回答你最想知道的信息,提前預測你感興趣的內容,在你需要時及時提供,而你將不再需要時時查閱自己的信息推送。

智搜

Giiso資訊機器人可以發揮不同的功能:它可以作為新聞資訊運營,實現資訊內容的生產、審核、生產與發布、個性化推薦;可以為企業進行相關產品和服務信息的采集、整理;它也可以是編輯記者,智搜(giiso)推出的寫稿機器人,可以在信息采集的基礎上,實現內容的創作、編輯和分享。

智搜(giiso)基於資訊機器人引擎研發的天機智訊,就是集成了資訊機器人功能的移動端APP,目前已經更新到了6.0版本。用戶可以通過主題閱讀的方式進行訂閱,天機智訊可以基於用戶自定義的主題,在全網海量資訊中,進行個性化推薦,提升閱讀效率。並且通過對用戶行為的學習,提煉用戶畫像,進行興趣推薦。

而這些功能通過開放接口,也可以直接提供給企業客戶。2017年,Giiso機器人商店上線,推出了面向企業級服務的Giiso機器人編輯雲平臺與SDK。開放的接口中,包括寫作、編輯、篇章、資訊、大數據等幾類服務。企業可以選擇雲端服務,通過按月租用方式付費以及合作。

據武文斌介紹,目前,智搜(giiso)已經與深圳之窗、廣州日報、南方報業等媒體進行了合作。“除了媒體機構外,金融、公共事務等對信息和內容需求較大的企業,同樣也是智搜(giiso)的客戶。例如,已經有多家投資機構和智搜合作,利用資訊機器人,進行行業信息采集與分析,制作行業簡報。”

智搜3

智搜天機聯盟

針對非傳媒領域的企業客戶,2016年底,智搜(giiso)成立了天機聯盟,提供場景化的內容運營和廣告匹配體系,以及覆蓋了幾十萬資訊來源的內容庫,並且可供企業客戶進行競品的資訊屏蔽、提供行業信息報告。

未來機器人的“大腦”

武文斌的期望還不止於此。在物聯網時代,各種智能家居和硬件產品深入家庭和出行各個場景,武文斌也希望,智搜(giiso)的資訊機器人引擎可以搭載在各類機器人和硬件產品上,“應用到各種場景,成為其他機器人的‘大腦’,為用戶提供各種精準的資訊服務,成為他們生活的助手。”

這是一個更加廣闊也可以展開我們想象的市場。

比如試想一款智能鬧鐘,在為你叫起的同時,提供最新的你感興趣的資訊;或者你告訴你的家庭機器人或音箱,你希望知道明天某場球賽的結果,那麽它將第一時間向你播報。

目前,智搜(giiso)已經累計發明專利申請5項,擁有軟件著作權數15個。公司團隊超過70人,核心成員主要來自清華、北大、港大、國防科大、西安理工等高校畢業的博士與研究生。

在移動互聯時代,在吸引用戶眼球方面,傳媒和信息正成為戰爭的利器。如何整合信息、提取和分析數據、理解受眾、精準營銷,正成為全行業公司關註的事情。而由於AI的加入,新的變化也正在發生。

“未來這個領域潛在的需求是巨大的。最終內容的創造和運營方,都將進入AI時代。”武文斌說,“人工智能技術在垂直場景的應用,現在仍然處於起步階段。而我們要做的工作就是為潛在用戶,做好市場的啟蒙。無論是內容的創造者,還是使用者,都可以在智搜的平臺上,實現快速高效地工作。”也許未來,類似資訊機器人等技術的加入,可以讓人類獲取和使用信息的習慣,發生更加深刻的變化。

黑智簽名檔

智搜資訊機器人人工智能
贊(...)
文章評論
匿名用戶
發布
PermaLink: https://articles.zkiz.com/?id=259093

Next Page

ZKIZ Archives @ 2019