You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

186 lines
13 KiB
Markdown

2 years ago
# 33 | 带你初探量化世界
你好,我是景霄。
在2000 年顶峰时期,高盛雇佣了 600 名交易员为机构客户买卖现金股票。可如今,这个数字只有 2 名Ref. 经济学人。到了2009 年,金融危机余音未散,专家面对股票和证券交易中越来越多的机器参与提出了警告,因为机器的崛起,逐渐导致了手操交易工作的消失。
很久之前瑞银集团UBS的交易大厅是下面这样的
![](https://static001.geekbang.org/resource/image/38/f7/3814a699e324b7958a08c793a5d58df7.png)
8 年之后,交易大厅就已经只有这些人了:
![](https://static001.geekbang.org/resource/image/59/af/59390119c9f7cb17ca9642bf2d30b3af.jpg)
事实上,随着数据处理技术的飞速发展,和量化交易模型研究理论的逐渐成熟,现金股票交易、债券市场、期货市场以及投行的相当一部分业务,都在朝着自动化的方向迈进。
而发展到2017 年WannyCry 席卷全球,随之而来的比特币,在短短几个月内从小众玩家走入了公众视野,币价也是一飞冲天,很多炒币的人赚得盆满钵满。更有一部分人,将金融业的量化策略应用其中,无论是搬砖(套利),还是波段,在不成熟的市场初期都赚了个爽快。
这节课开始,我们就来探索一下量化的世界。作为我们 Python 专栏的综合实践模块,希望你能在这一部分内容中,收获自己独特的东西。
## 交易是什么?
市场,是人类有史以来最伟大的发明之一。亚当·斯密在国富论中,用“看不见的手”这个概念,生动形象地阐释了市场和理性人之间是如何交互,最终让整个社会受益的。
而市场的核心,是交换。人类发展最开始是物物交换,原始的“以物易物”的方式产生于货币诞生之前。不过,这种方式非常低效,不便于流通交换,经常会出现的情况是,要走很长的交换链条才能拿到自己想要的物品。于是,一般等价物出现了,社会分工也逐渐出现了。人们把自己生产的商品换成一般等价物,然后再换成自己需要的其他商品。
而交换的核心,就是买和卖。当买卖双方对价格预期相等的时候,交易达成。随着金融和技术的发展,逐渐出现了股票、债券、期权、期货等越来越多的金融工具,金融衍生品也朝着复杂的方向发展。
在我们经常听到的投资银行中,量化基金交易员这种角色,所做的事情,就是在这些复杂的衍生品基础上,分析投资标的的价值,然后以某种策略来管理持有仓位,进行买进和卖出。
为什么交易能赚钱,是很多人疑惑不解的地方。市场究竟有没有规律可循呢?可以肯定是有的,但虽有迹可循却无法可依。交易的多样性和人性的复杂性,使得金融数据的噪音极大,我们无法简单地从某一两个因子来确定地推导行情变化。
所以交易员这个行业本身,对自身素质要求是极高的。除了要具备扎实的专业素养(包括金融功底、数理逻辑、分析能力、决策能力),对心理素质的要求也非常高。这种直接和钱打交道、并直面人性深处欲望的行业,也因此吸引了无数高手的参与,很多人因此暴富,也有不少人破产,一无所有。
那么,有什么办法可以规避这种,因为心理素质原因带来的风险呢?
## 量化交易
回答这个问题之前我先插一句题外话。刚接触量化交易的朋友都很容易被这几个词绕晕量化交易Quantitative Trading、程序化交易Program Trading、算法交易Algo-Trading、高频交易High Frequency Trading和自动化交易平台Automated Trading System
虽然我遇到过不少行业内的人也混用这词,但是作为初学者来说,厘清这些术语还是很有帮助的。至少,在别人说出这些高大上的词时,我们心里不用犯怵了。
先来看程序化交易,它通常用计算机程序代替交易员,来具体执行金融产品的买卖。比如,一个基金经理需要卖出大量股票。如果直接挂一个大的卖单,可能会影响市场,那就用计算机程序拆分成小单慢慢执行。所以,量化交易的下层通常是程序交易。
而算法交易通常用于高频交易中。它指的是,通过算法快速判定买卖的时间点,快速买卖多个产品。
量化交易则通常是指使用数学、统计甚至机器学习的方法去找寻合适的买卖时机。所以在这个维度的定义之下算法交易、高频交易还有统计套利Statistical Arbitrage都可以算作量化交易。
简单而言,我们可以认为量化交易的涵盖范围最大。因此,**当你不确定用哪个词的时候,用量化交易就行了。**
回到我们刚刚的问题,规避心理素质原因带来的风险的方法,自然就是量化交易了。量化交易的好处显而易见。最直观来看,计算机不眠不休,不需要交易员实时操盘,满足了人们“躺着挣钱”的愿景。当然,这只是美好的想象,真要这么做的话,不久之后就要回工地搬砖了。现实场景中,成熟的量化交易也需要有人蹲守,适时干预,防止算法突然失效造成巨额的交易亏损。
在数字货币领域的交易,这一点更加显著。数字货币的交易在全球许多交易所进行,和股票不同,一支股票可能只在少数几个交易所交易,而一种数字货币可以在所有的交易所同时进行交易。同时,因为没有股市的开盘、收盘限制,数字货币的交易通常是 7 x 24 小时不眠不休,比前世的 “996 福报”凶残多了。要是真有交易员能在这个市场活下来,我们尊称一声“神仙”也不为过了。
多交易所交易也意味着全球数字货币市场每时每刻都是紧密相连的。一个市场、一个局部的巨大变动都会影响所有的市场。比如2017年朝鲜氢弹炸了的当天新闻还没出来隔壁韩国、日本的比特币价格马上拉升了一波再比如当比特币的负面消息半夜里传出来的时候其价格也马上跟着暴跌一波。
![](https://static001.geekbang.org/resource/image/bf/02/bfae52c5cc5252e006652d73a1e1b502.png)
2019年6月比特币在全球头部交易所的价格
因此,我们经常看到比特币的价格波动巨大。很有可能今天还是财富自由状态,明天的财富就没那么自由了。显然,在这种市场中交易,人力很难持久支撑,而量化交易就很合适了。
通常的电子盘交易比如股票数字货币是通过券商或者软件直接把买卖请求发送给交易所而算法交易的底层就是让程序来自动实现这类操作。券商或者交易所通常也会提供API接口给投资者。比如盈透证券Interactive Broker的接口就可以支持股票、期权的行情数据获取和交易而 Gemini、OKCoin等交易所也提供了对应的接口进行数字货币行情获取和交易。
Gemini交易所的[公开行情API](https://api.gemini.com/v1/pubticker/btcusd)就可以通过下面这种简单的HTTP GET请求来获取最近的比特币BTC对美元USD的价格和最近的成交量。
```
########## GEMINI行情接口 ##########
## https://api.gemini.com/v1/pubticker/:symbol
import json
import requests
gemini_ticker = 'https://api.gemini.com/v1/pubticker/{}'
symbol = 'btcusd'
btc_data = requests.get(gemini_ticker.format(symbol)).json()
print(json.dumps(btc_data, indent=4))
########## 输出 ##########
{
"bid": "8825.88",
"ask": "8827.52",
"volume": {
"BTC": "910.0838782726",
"USD": "7972904.560901317851",
"timestamp": 1560643800000
},
"last": "8838.45"
}
```
对算法交易系统来说API只是最下层的结构。通常而言一个基本的交易系统应该包括行情模块、策略模块和执行模块。为了辅助策略的开发通常还有回测系统辅助。它们的分工示意图大致如下
![](https://static001.geekbang.org/resource/image/d2/f7/d290da8da3bb149858ce1a0be79215f7.png)
其中,
* 行情模块的主要功能是,尝试获取市场的行情数据,通常也负责获取交易账户的状态。
* 策略模块的主要功能是,订阅市场的数据,根据设定的算法发出买、卖指令给执行模块。
* 执行模块的主要功能是,接受并把策略模块发过来的买、卖指令封装并转发到交易所;同时,监督并确保策略买卖的完整执行。
## Python算法交易
了解了这么多关于量化交易的知识接下来我们就来说说Python算法交易。Python 在金融行业的许多方面都有用到,在算法交易领域,更是发挥了日益重要的作用。 Python 之所以能在这个行业这么流行,主要是因为下面四个原因。
### 数据分析能力
第一个原因是Python的数据分析能力。算法交易领域的一个基本需求就是高效数据处理能力而数据处理则是Python的强项。特别是NumPy+Pandas的组合简直让算法交易开发者的生活质量直线上升。
我们可以用一个简单的例子来展示一下如何抓取、格式化和绘制比特币过去一个小时在Gemini交易所的价格曲线。相关的代码我都附了详细注释这里就不再多讲你阅读了解一下即可。
```
import matplotlib.pyplot as plt
import pandas as pd
import requests
# 选择要获取的数据时间段
periods = '3600'
# 通过Http抓取btc历史价格数据
resp = requests.get('https://api.cryptowat.ch/markets/gemini/btcusd/ohlc',
params={
'periods': periods
})
data = resp.json()
# 转换成pandas data frame
df = pd.DataFrame(
data['result'][periods],
columns=[
'CloseTime',
'OpenPrice',
'HighPrice',
'LowPrice',
'ClosePrice',
'Volume',
'NA'])
# 输出DataFrame的头部几行
print(df.head())
# 绘制btc价格曲线
df['ClosePrice'].plot(figsize=(14, 7))
plt.show()
########### 输出 ###############
CloseTime OpenPrice HighPrice ... ClosePrice Volume NA
0 1558843200 8030.55 8046.30 ... 8011.20 11.642968 93432.459964
1 1558846800 8002.76 8050.33 ... 8034.48 8.575682 68870.145895
2 1558850400 8031.61 8036.14 ... 8000.00 15.659680 125384.519063
3 1558854000 8000.00 8016.29 ... 8001.46 38.171420 304342.048892
4 1558857600 8002.69 8023.11 ... 8009.24 3.582830 28716.385009
```
通过执行这样的一段代码,我们便可以得到下面这张图所示的价格曲线。
![](https://static001.geekbang.org/resource/image/8c/1f/8c7d9f54db86181f87422a3543747a1f.png)
### 大量专有库
除了强大的数据处理能力之外Python 还有许许多多已经开发成熟的算法交易库可供使用。比如你可以使用Zipline进行策略回测或者用Pyfolio进行投资组合分析。而许多交易所也都提供了基于Python的API客户端。
### 便利的交易平台
第三个原因,是因为便利的交易平台。有一些算法交易平台可以执行自定义 Python 策略,无需搭建量化交易框架。算法交易平台,实际上等效于帮用户完成了行情模块和执行模块。用户只需要在其中定义策略模块,即可进行算法交易和回测。
比如Quantopian就提供了基于Zipline的标准回测环境。用户可以选择Python作为开发语言并且和社区的网友分享自己的策略。此外国内也有诸如BigQuant、果仁网等类似平台提供不同市场和金融产品的交易。
### 广泛的行业应用
最后一个原因则是Python本身广泛的行业应用了。目前越来越多投资机构的交易部门都开始使用Python因此也对优秀的Python开发者产生了更多的需求。自然这也让学习Python成为了更有意义的“投资”。
## 总结
这一节课,我们介绍了交易,以及算法交易中的基本概念,也简单介绍了为什么要学习 Python 来搭建量化交易系统。量化交易是交易行业的大趋势;同时, Python 作为最适合量化从业者的语言之一,对于初学者而言也有着非常重要的地位。
接下来的几节课,我们将从细节深入量化交易的每一个模块,由浅入深地为你揭开量化交易神秘的面纱。
## 思考题
最后给你留一道思考题。高频交易和中低频交易,哪个更适合使用 Python为什么欢迎在留言区写下你的想法也欢迎你把这篇文章分享给更多对量化交易感兴趣的人我们一起交流和探讨。