最近在做一个项目,主要是基于股票市场来验证一些model,看看能否做量化交易。那么如何获取数据呢?因为客户这边前期是不想花钱买数据的,只能自己想办法了,从sina和yahoo财经频道爬到一些数据,但是有些数据比较难找,看到了知乎上面的一个帖子,于是就尝试一下。
- tushare的介绍。
- 使用前提,安装anaconda。
- 按照好了之后,如何开发呢?选择什么样的IDE呢?如何基于anaconda搭建IDE环境。
- 安装tushare:windows下打开cmd.exe,OS X下打开terminal,pip install tushare。
- 使用mysql驱动的时候遇到了问题:ImportError: No module named 'MySQLdb'
- 找出mysql所有的驱动:http://docs.sqlalchemy.org/en/latest/dialects/mysql.html#module-sqlalchemy.dialects.mysql.pymysql
- 寻找其中合适的使用,pymysql:pip install pymysql
import tushare as ts #import pandas as pd #import numpy as np #import matplotlib.pyplot as plt from sqlalchemy import create_engine engine = create_engine('mysql+pymysql://loginuser:loginuser@172.16.130.6/nevmiss?charset=utf8') df = ts.get_area_classified() df.to_sql('area_data_py',engine,if_exists='append') df = ts.get_industry_classified() df.to_sql('industry_data_py',engine,if_exists='append')
好了,可以轻松地使用tushare的数据源了。