高頻數(shù)據(jù)大多“罔不因勢(shì)象形,各具情態(tài)”,其中就包括數(shù)據(jù)非等間距問題。我們?yōu)榱丝朔@些irregularities,我們就要對(duì)數(shù)據(jù)重新表示(re-representation)。 高頻價(jià)格數(shù)據(jù)的非等間距問題是首當(dāng)其沖要解決的。解決的辦法一般就是resampling。比如可以自己定義一個(gè)時(shí)間間隔(segment),重新抽樣。這時(shí)候的抽樣可以直接取用截點(diǎn)的數(shù)據(jù)(如圖1),或者取每個(gè)間隔內(nèi)數(shù)據(jù)的均值(如圖2),根據(jù)你的具體情況而定。還有也可以使用線性插值法(linear interpolation)。 圖一 圖二 上面提到的方法還僅限于高頻時(shí)間序列在時(shí)域(time domain)中的重新表示,但哪怕我們使用的是等間隔的高頻收盤價(jià)數(shù)據(jù),如果間隔做得比較小,數(shù)據(jù)的噪聲仍然是不可避免的,這就涉及一個(gè)頻域(frequency domain)的問題。那么對(duì)數(shù)據(jù)做去噪(de-noisying)或者平滑(smoothing)是一個(gè)很直接的做法。比如小波去噪(wavelet de-noising)后再做協(xié)整檢驗(yàn)?;蛘吒鼘W(xué)術(shù)的做法是使用離散小波變換(DWT)把低頻方差和高頻方差分解開來,然后把低頻和高頻的小波系數(shù)留下來,將其納入到協(xié)整檢驗(yàn)中來,成為一個(gè)專用于高頻數(shù)據(jù)協(xié)整檢驗(yàn)的算法。 其實(shí),高頻數(shù)據(jù)更有利用價(jià)值的還是order book。這類數(shù)據(jù)要是不去研究利用就太可惜了。與價(jià)格、成交量之類的time-series不同,order book這類sequence數(shù)據(jù)并不需要設(shè)置抽樣點(diǎn),而是直接把每個(gè)時(shí)間點(diǎn)上的數(shù)據(jù)當(dāng)作一個(gè)事件,設(shè)定或者擬合一個(gè)針對(duì)這些事件序列(event sequences)的概率分布。比如著名的Rama Cont[注2]就把order arrival設(shè)定為服從泊松分布,每次order arrival都是獨(dú)立的,order arrival rate則服從指數(shù)分布。 當(dāng)然如果你有簡(jiǎn)化數(shù)據(jù)的需要,也可以提取關(guān)鍵數(shù)據(jù)點(diǎn),只是這些關(guān)鍵數(shù)據(jù)點(diǎn)不需要是等間隔的。(如圖3) 圖3 按照上述方法處理好高頻數(shù)據(jù)后,將協(xié)整[注1]的配對(duì)股票構(gòu)建一個(gè)contingent order,以兩者的mid-price之差作為spread,觸發(fā)交易信號(hào)的閾值也可以沿用你習(xí)慣的方法來計(jì)算。總之,在中低頻統(tǒng)計(jì)套利中常用的entry-exit strategy都可以作為一個(gè)框架拿過來使用,無需贅言。 但任何高頻的交易環(huán)境下的問題都可以成為這個(gè)高頻統(tǒng)計(jì)套利策略的問題,其中最突出的問題之一就是滑點(diǎn)。我聽說有人做過測(cè)試,如果每次成交都增加一個(gè)tick的滑點(diǎn),全年的收益就沒了。 那么這時(shí)候我們可不可以再研究研究order book的變化規(guī)律,特別是其中bid/ask的變化規(guī)律,摸索出一種計(jì)算在mid-price變動(dòng)之前,配對(duì)股票的bid/ask上的orders得到執(zhí)行的概率,然后根據(jù)這些概率判斷剛剛觸發(fā)的交易信號(hào)能否得到執(zhí)行。這樣也同時(shí)可以規(guī)避那些bid-ask價(jià)差過大的情況。 我們知道order book的變化就來源于每個(gè)價(jià)位上的市價(jià)單、限價(jià)單和撤單指令的flow,每個(gè)flow都可以看作一個(gè)counting process。有很多實(shí)證研究表明,order arrival rate與之到bid/ask的距離有關(guān)。Rama Cont[注2]把每個(gè)價(jià)位上的未成交訂單的數(shù)量的變化規(guī)律看作一個(gè)birth-death process,其中每一個(gè)event(包括市價(jià)單、限價(jià)單和撤單指令)都是獨(dú)立泊松過程: 其中D(·)為death process,xt*θ(p)代表order cancellation rate,μ代表market order arrival rate,B(·)為birth process,λ(p)代表limit order arrival rate,p代表對(duì)應(yīng)的價(jià)格。為了建模的簡(jiǎn)便,我們假設(shè)每一個(gè)未成交訂單被取消的概率都是相等的,也是獨(dú)立的。 然后就可以用Monte Carlo模擬出在mid-price變動(dòng)之前,配對(duì)股票的bid/ask上的orders得到執(zhí)行的概率。與此同時(shí),因?yàn)檫@個(gè)birth-death process是可以有解析解的,所以Rama Cont用拉普拉斯變換求逆推導(dǎo)出這個(gè)概率。推導(dǎo)過程比較復(fù)雜,就不寫出來了。做個(gè)回測(cè),兩種方法得到的結(jié)果相近(詳見[注2]) (數(shù)值模擬得到的結(jié)果) (拉普拉斯變換得到的結(jié)果) 分別對(duì)你的配對(duì)股票求取這個(gè)概率。當(dāng)概率高于你預(yù)設(shè)的閾值時(shí),這次交易可以認(rèn)定為在mid-price變動(dòng)之前,bid/ask order可以得到執(zhí)行,故以限價(jià)單分別以bid/ask價(jià)位執(zhí)行建倉(cāng)。平倉(cāng)同理。 Rama Cont的模型見仁見智。有的人認(rèn)為太復(fù)雜,也有的人覺得太粗糙。譬如Rama Cont把order arrival看作泊松過程,order duration服從指數(shù)分布。但泊松過程太粗糙了,隨便拿出一個(gè)log化的概率分布根本不成線性的,而且如果對(duì)log(duration)做一個(gè)自相關(guān)系數(shù)圖,你會(huì)發(fā)現(xiàn)是拖尾的,也就是個(gè)AR過程。另外,等概率的馬爾科夫鏈的假設(shè)也很粗糙,與現(xiàn)實(shí)的擬合不足,模擬出的概率可信度不足。而且為了追求有解析解而搞這么復(fù)雜的數(shù)學(xué)推導(dǎo)又顯得有點(diǎn)沒必要,畢竟Monte Carlo模擬在這里也不難實(shí)現(xiàn)。 其實(shí)沿著Rama Cont的思路,你完全可以將模型簡(jiǎn)化成一個(gè)在技術(shù)上沒有難度的線性模型,最多加一個(gè)時(shí)變特征。比如你掌握著order book的當(dāng)前狀態(tài),并且知道下一狀態(tài)有固定且有限種可能,那么僅取決于哪一種order會(huì)先到。所以直接對(duì)order arrival rate建模,也就是λ(·),比如像這樣一個(gè)加入時(shí)變特征的線性模型:,分別按照limit/market/cancel、buy/sell、每個(gè)quote的價(jià)格到當(dāng)前bid/ask的距離建模。然后計(jì)算λ(·)就變成一個(gè)工程問題了,無論是怎樣做特征工程,還是選擇怎樣的回歸算法。因子可以有arrival rate的滯后項(xiàng),波動(dòng)率因子如VIX指數(shù),動(dòng)量因子如過去若干的tick/second的漲幅,還可以有微觀結(jié)構(gòu)因子如bid-ask imbalance,如此等等?;貧w算法可以先選擇線性回歸,主要就看Lp regularization的設(shè)置了。 最后總結(jié)一下吧: 1)拿高頻數(shù)據(jù)做協(xié)整,肯定要先做預(yù)處理,主要思路就是本文前半部分所說。但這不是難點(diǎn); 2)難點(diǎn)之一還在于構(gòu)建統(tǒng)計(jì)套利的協(xié)整組合,無論是把小波系數(shù)納入?yún)f(xié)整檢驗(yàn),還是用合適的生成模型或者manifold做個(gè)映射什么的,總之要做好你的仿射變換,這就要考察你對(duì)策略的理解和設(shè)計(jì)了; 3)對(duì)統(tǒng)計(jì)套利這種交易時(shí)機(jī)敏感型的策略,高頻環(huán)境下指令的執(zhí)行就是難點(diǎn)之二。解決這個(gè)問題可以有非常多的算法和技術(shù),比如很多人著急他們的機(jī)器學(xué)習(xí)怎么用在交易上,這不就是個(gè)好去處嘛。Rama Cont的模型只做個(gè)參考就好。但不妨可以把Rama Cont的模型作為一個(gè)發(fā)凡起例的入門思路,多發(fā)掘order book里面新的stylized facts。借助你對(duì)市場(chǎng)的觀察,開發(fā)你的交易執(zhí)行模塊,才是最好的。 注1:我這里所指的“協(xié)整”,不一定是時(shí)間序列教材里看到的若干種協(xié)整檢驗(yàn)。在統(tǒng)計(jì)套利的語境下,協(xié)整有著更嚴(yán)格的內(nèi)含和更豐富的外延??傊?,你可以根據(jù)你對(duì)模型和數(shù)據(jù)的探索,做出某種仿射變換,構(gòu)建你的協(xié)整組合。 注2:來自于 Cont, Stoikov and Talreja, A stochastic model for order book dynamics 責(zé)任編輯:張文慧 |
【免責(zé)聲明】本文僅代表作者本人觀點(diǎn),與本網(wǎng)站無關(guān)。本網(wǎng)站對(duì)文中陳述、觀點(diǎn)判斷保持中立,不對(duì)所包含內(nèi)容的準(zhǔn)確性、可靠性或完整性提供任何明示或暗示的保證。請(qǐng)讀者僅作參考,并請(qǐng)自行承擔(dān)全部責(zé)任。
本網(wǎng)站凡是注明“來源:七禾網(wǎng)”的文章均為七禾網(wǎng) yfjjl6v.cn版權(quán)所有,相關(guān)網(wǎng)站或媒體若要轉(zhuǎn)載須經(jīng)七禾網(wǎng)同意0571-88212938,并注明出處。若本網(wǎng)站相關(guān)內(nèi)容涉及到其他媒體或公司的版權(quán),請(qǐng)聯(lián)系0571-88212938,我們將及時(shí)調(diào)整或刪除。
七禾研究中心負(fù)責(zé)人:翁建平
電話:0571-88212938
Email:57124514@qq.com
七禾科技中心負(fù)責(zé)人:相升澳
電話:15068166275
Email:1573338006@qq.com
七禾產(chǎn)業(yè)中心負(fù)責(zé)人:洪周璐
電話:15179330356
七禾財(cái)富管理中心
電話:13732204374(微信同號(hào))
電話:18657157586(微信同號(hào))
七禾網(wǎng) | 沈良宏觀 | 七禾調(diào)研 | 價(jià)值投資君 | 七禾網(wǎng)APP安卓&鴻蒙 | 七禾網(wǎng)APP蘋果 | 七禾網(wǎng)投顧平臺(tái) | 傅海棠自媒體 | 沈良自媒體 |
? 七禾網(wǎng) 浙ICP備09012462號(hào)-1 浙公網(wǎng)安備 33010802010119號(hào) 增值電信業(yè)務(wù)經(jīng)營(yíng)許可證[浙B2-20110481] 廣播電視節(jié)目制作經(jīng)營(yíng)許可證[浙字第05637號(hào)]
技術(shù)支持 本網(wǎng)法律顧問 曲峰律師 余楓梧律師 廣告合作 關(guān)于我們 鄭重聲明 業(yè)務(wù)公告
中期協(xié)“期媒投教聯(lián)盟”成員 、 中期協(xié)“金融科技委員會(huì)”委員單位