ZKIZ Archives


Prisma爆紅這麽久 現在才有中國追隨者

“朝生暮死”的APP行業無異於一個造星工廠,幾乎每隔一段時間就能捧紅一款明星產品。而圖片處理軟件堪稱爆款APP中最為常見的分類。

有這樣一個評論描述如今的Prisma有多火,“世界一半人在用《PokemonGO》抓精靈,另一半人在用Prisma軟件修圖。”

Prisma成功刷屏朋友圈之後,有國內圖片處理軟件公司產品負責人明確向《第一財經日報》記者表示,Prisma的爆紅提醒了我們用戶對藝術類風格特效存在巨大需求,公司會考慮開發類似Prisma的產品。

但與AR手遊《PokemonGo》剛上線就遭遇國內《城市精靈GO》山寨不同的是,6月上線之後就迅速地從俄羅斯風靡至全球的Prisma在模仿、借鑒已經足夠普及的中國市場一直等到最近才找到“追隨者”。8月4日,圖片處理應用相機360在更新後的版本中添加了一個類似Prisma功能的超強馬賽克,稱可以讓照片一秒鐘變油畫。

為什麽要等這麽久?

梅德韋傑夫發布的圖片

 

需要耐心的AI修圖

技術達人出來發話了,雖然都是在修圖,Prisma和美圖、PicsArt等軟件在技術上走的是兩條路。能將一張普通照片變成野獸派勞爾杜飛的靜物畫風格,也能演繹現代派大師畢加索的立體主義的Prisma背後是人工智能(ArtificialIntelligence,簡稱AI),Prisma以藝術的名義用流行的方式把深度學習的能力展現給了大眾。

那麽,能讓連俄羅斯總理梅德韋傑夫都“翻了它的牌子”,在Instagram上放了一張使用Prisma過濾的莫斯科風景圖,這個由莫斯科年僅25歲的AlexeyMoiseenkov和幾個人的團隊開發的修圖應用到底在技術上牛在哪里?

圖普科技研發工程師Darwin告訴《第一財經日報》記者,在處理技術方面,美圖、PicsArt等圖像編輯軟件提供的主要功能基本上是基於底層的數字圖像處理技術,如濾波、去噪,或一些稍高級的功能分割、人臉檢測等;而Prisma所做的風格轉換使用的是完完全全的機器視覺技術,實現紋理轉換(texturetransfer)。“繪畫、吟詩、作曲是人的高級智能的表現,Prisma的風格轉換讓大眾有了機器可以作畫的錯覺,在效果上更高級、更智能。”

Prisma的產品由來是因為創始人AlexeyMoiseenkov最初發現了一種開源的人工智能算法,能將照片變為經典藝術作品的風格,然而這一處理過程需要幾小時時間。因此,他的團隊開發了自主版本,能在較短時間內返回結果,適合在移動設備上使用。

但目前對於大多數Prisma用戶而言,最大的不滿依然來自於圖片處理的時間太長,一般都需要等待幾十秒才能看到預覽效果。

而這背後,Prisma的產品特性要求用戶在使用時一定要在有網絡狀態較好、網速較快的狀態下,因為需要在線加載繪畫風格圖像以及用戶提供的內容圖片需要發送到遠程的服務器上進行人工智能計算後再傳回來;此外,因為所有的圖片處理都是在雲端完成,所以會有少部分用戶遇到使用人數過多,服務器過載的情況。

但在人工智能技術專家們看來,即使Prisma的處理速度的確超出了平常大眾一般可以忍受的App處理時間的上限,但Prisma能達到這樣的速度其實已實屬不易,里面涉及到大量的算法改進和性能優化。

在Prisma出現之前,也有過一款基於深度學習技術的修圖應用deepart.io。deepart.io卻無法取得像Prisma一樣的成功的主要原因是一方面在於其處理一張圖片需要消耗大量的GPU時間,導致了很多服務器資源開銷,如果用戶願意承擔這部分費用,處理時間在半小時左右,如果不付費的話,需要6個小時左右;而另一方面,deepart主要是由大學的研究員做的技術性實驗,並不會投入過多的精力,在風格圖像類型、品牌推廣和商業化應用上考慮較少。

在圖普科技研發工程師Darwin看來,使用深度學習的方式進行風格轉換在技術層面上看屬於從0到1的創舉,將這種無與倫比風格轉換效果工程化、落地化最終展現給大眾從產品層面上看也是從0到1的進步,之後越來越好的效果,越來越快的速度只是不斷地在1後面添0,在如今極速發展的AI技術面前,相信速度的問題會很快就得以解決。

爆紅過後的困境

即使有AI技術做背書,業界對於Prisma的未來依然存在擔憂。Prisma如此驚人的風格轉換的效果暫時掩蓋了其產品單薄的缺陷,但當熱度退去,Prisma是否會像之前眾多爆款的App一樣稍縱即逝,取決於Prisma之後采取的商業策略。

在中國市場上,從魔漫相機、臉萌、足記到現在的Prisma,似乎每過一段時間就會出現一個爆款圖片應用產品。然而,這些滿足一部分需求的圖片工具類產品在爆紅之後往往並不能走得特別長遠。

一位不願意透露姓名的圖片處理工程師坦言,因為Prisma是強風格的濾鏡,用戶容易產生厭倦心理,未來要考慮的優化方向是開發更多新奇效果,或者做產品定位的轉型上。爆發力超強的產品,都會存在持久力不足的特點。新鮮勁兒過去以後,如何把用戶留住,是重要的課題。

如果沒有考慮清楚這一步,迅速地變現也是個好方法。AlexeyMoiseenkov7月份來到Facebook總部參加了一次FacebookLive的直播的消息也被業界解讀為Facebook可能有意收購Prisma。

而這背後,被大平臺收購是創意工具類應用普遍的發展思路。在此之前,Snapchat先後以1.5億美元和1億美元收購了可動自拍應用Looksery和自定義頭像制作應用Bitmoji,而Facebook此前也收購了提供類似於Looksery的臉部識別自拍應用MSQRD。

此外,AI技術背後是Prisma使用的是昂貴的雲端服務器去處理請求,這一方面體現出了其使用的深度學習計算的複雜度,另一方面更是暴露了其巨大的成本消耗,使用GPU等計算設備去處理一張圖片的成本並不低。

值得一提的是,此前有消息稱Facebook可能會將Prisma整合到FacebookLive,以此鼓勵更多用戶嘗試直播。此舉將有助於消除用戶面對鏡頭時的緊張感,因為Prisma的濾鏡可以掩蓋用戶皮膚和環境燈光的問題。

盡管Prisma團隊此前表示正在開發視頻濾鏡功能,但在AI技術工程師們看來,圖像是一個二維的信號,而視頻多了一個時間的維度,對時間提供的信息的利用決定了視頻的處理在面臨更大計算量的同時也擁有更多的可用的信息量。

“Prisma的‘視頻濾鏡’一方面要處理計算量的問題,保證‘快’,另一方面也要考慮如何利用好時間的信息,進一步提升‘質’。用圖片的方式對視頻每一幀進行處理是可行的,但由於如今的風格轉換算法還不是特別的穩定,所以用這種處理方式生成的視頻會閃爍和出現假的不連續性(falsediscontinuities)。”在Darwin看來,從圖像的處理到視頻的處理,其中牽涉到大量算法,並不是一件看起來很容易的事,而他的判斷是最終這項視頻功能可能還是以用雲端離線的方式處理短視頻呈現給大眾。

另外的擔憂是,類似Prisma的視頻濾鏡會增加直播的趣味性。但從產生影響的角度,可能不像對圖片的影響這麽大。“直播的重點是內容和互動,對於大多數用戶而言,美顏、濾鏡只是輔助性的手段。”上述圖片處理工程師解釋道。

而這背後,除了Prisma和未來的視頻濾鏡,AI技術尤其是深度學習僅僅在機器視覺領域,已經在人臉識別、OCR(光學字符識別)、車輛檢測、圖像檢索等領域得到一定的成功的應用。

《第一財經日報》記者了解到,在圖像內容審核上,如今可以使用深度學習技術成功地將圖像智能鑒黃交給了AI機器,使得大量不良內容被阻擋免於流向大眾,從而解放了更多的人力去做更有意義的事。此外,也能在人臉識別應用上,完成包括人臉搜索、定位、識別、智能美化等功能。

PermaLink: https://articles.zkiz.com/?id=209159

Next Page

ZKIZ Archives @ 2019