drillerの部屋

Vaexで移動平均を計算

どりらんです。この記事はfintalk Advent Calendar 2019の11日目です。
ここのボスになんか書けと言われたので書きました。

Vaexとは

pandasのようなテーブルデータ(DataFrame)を扱うライブラリです。Out-of-Core(メモリにのらない大きなデータ)を遅延処理で計算できるのが特徴です。

pandasの1000倍速いと言われており、シャア少佐もびっくりです。気になったのでちょろっと試してみました。金融ネタということで、今回は移動平均を算出してみます。

インストールなど

続きを読む

pandasクックブック ―Pythonによるデータ処理のレシピ―

本書をマスターすればpandas中級者!

朝倉書店様 より 「pandasクックブック ―Pythonによるデータ処理のレシピ―」 をご恵贈いただきました。朝倉書店様、ご紹介いただいた Hayao(-ε-δ)さん ありがとうございます。

http://www.asakura.co.jp/goods_img/115751.jpg

以降は「本書」と表記させていただきます。

pandasに関しては共著: PythonユーザのためのJupyter[実践]入門 (以降はJupyter本とします)の第3章でもいつくか解説されていますが、pandasがメインの書籍ではありません。 本書はその名のとおり、pandasに焦点を当てて詳しく解説されているため、Jupyter本でpandasをより知りたくなったかたにはちょうどよい内容ではないでしょうか。

続きを読む

ポートフォリオのリスクを分析する

「FinTech Advent Calendar 2018」の記事です。
Pythonのライブラリを使ってポートフォリオのリスクを分析してみます。

データの準備

手っ取り早くデータを取りたいので、今回はQuandlを使います。
株価のデータは有料なものがほとんどで世知辛いので、先物のデータを使います。

  • 天然ガス(1限月)
    なんとなく選んだ、特に意味はない
  • E-Mini S&P 500(1限月)
    ベンチマークとして使用
In [1]:
import quandl

# 天然ガス(1限月)
ng_df = quandl.get("CHRIS/CME_NG1"
続きを読む

BokehのRangeToolをつかってみる

どうも、Bokeh芸人のどりらんです。

Bokeh 0.13からRangeToolが使えるようになりました。
直近の時系列データみたいが、過去を遡ってみたい場合などに便利です。
グラフの範囲選択ツールで、Highstock などでは時系列データを可視化する際にデフォルトでついている機能だったりします。

おおまかな手順は下記のとおりです。

  1. RangeToolを描画するfigureインスタンス(図)を作成する
  2. RangeToolインスタンスを作成する
  3. 1.add_tools メソッドの引数に 2. を渡す

RangeTool

続きを読む

これからはじめる SQL 入門

Jupyter本 の共著者である 池内さん よりご恵贈いただきました。池内さんありがとうございます。

http://image.gihyo.co.jp/assets/images/cover/2018/9784774196879.jpg

誰に向けての本か

タイトルのとおり、これからSQLを学びたいかたにとってはぴったりな内容です。
本書のはじめににも書かれておりますが、SQLは営業やマーケティング部門も扱うようになってきました。
SQLを学ぶ上で専門用語がハードルとなりそうですが、本書では平易な表現で解説されており、ITになじみがないかたでも理解しやすい内容になっているのではないでしょうか。

すでにある程度SQLに通じているかたでも、基礎から復習したい場合にもよさそうです。私自身、SQLは少々触っていますが、SQL文を記述するに当たってのお作法など、学びになった点が随所にありました。
続きを読む