📖 ZKIZ Archives


科技應用:高階篇 -尋尋覓覓系統開發 港股博弈clcheung

http://clcheung.wordpress.com/2013/02/06/%E7%A7%91%E6%8A%80%E6%87%89%E7%94%A8%EF%BC%9A%E9%AB%98%E9%9A%8E%E7%AF%87-%EF%BC%8D%E5%B0%8B%E5%B0%8B%E8%A6%93%E8%A6%93%E7%B3%BB%E7%B5%B1%E9%96%8B%E7%99%BC/

電腦科技發展極為快速,可惜沒有什麼真正有用的軟件可以用於港股炒賣。一般4千元左右的電腦已經有數核CPU16G RAM,及1T硬盤了。這麼強大的電腦,能夠應付一些較為高階的要求。

 

近日開始加強文件處理系統,其中一個較為複雜的要求是如何去快速搜尋出相關文件。例如之前炒賣前海概念股,最簡單是在相關年報或是公告中搜尋。交易所也有全文搜尋,可惜效果非常一般:

 

image

 

Google site search的話,效果比較好。但是不知何解有些文件是Google 搜尋不到,沒有index;另外Google也不能讓你選擇不同文件類別。

 

若果你還有一堆自己的文件的話,Google search不到也沒有辦法。Google Desktop本是很不錯,可惜已經暫停開發,最後的板本功能上似乎不能100%全文搜尋。一些相類Google Desktop的軟件也有不少,可惜他們的中文處理還是不太理想。

 

結果是剩下自行開發一途:

  1. 首先要下載相關文件,如年報,公告,研究報告等等。因為之前的港交所通告系統已經運行,所以沒有難度。

  2. 要選擇相關middleware。不少搜尋器middleware不能處理中文,原因是中文是沒有word separator,用字典也沒有可能,原因是人名地方名的關係。有不少middleware是太強大,難以駕馭。

  3. 要將文件轉化為文字檔。因為之前自動報表分析系統分析中已經解決了基本問題,所以沒有難度。亦可購買一些pdf converter,不過要小心選擇,因為有些中文pdf好難攪。

  4. 最後設計合適界面:

 

image

 

 

 

效果看來不錯,1 TB 的硬盤終於有用了 !

PermaLink: https://articles.zkiz.com/?id=43762

Next Page

ZKIZ Archives @ 2019