face of author
堀越保徳

サマリ

確率・統計の知識をバックボーンに、データ解析・機械学習を中心とした実応用に長く携わっているデータサイエンティスト/エンジニアです。

キャリアの初期から、統計を始めとする応用数学の知見を社会の価値に結びつけるためには高度なプログラミングが必要と認識し、研鑽を積んできました。 大学で学んだ応用数学の理論的なバックボーンに加えて、現実のビジネスで培ってきたソフトウェア開発と運用の知見を持っています。

プロとして誠実にシビアに品質を追求する一方で、人として日々の生活の楽しさ・安らぎを忘れずに過ごせる、そういう仕事人生が理想です。

スキル

数理統計学 / 金融工学 / Data Science

数理統計学の研究室で確率論に関する論文を書き修士号を取得しました1

卒業後は証券会社に就職し、債券トレーディング部門にクオンツとして配属され、金利モデルを始めとしたデリバティブプライシングのための金融工学をみっちり学んでいます。 クオンツとして6年働いたあとにWEBマーケティング業界に転職し、データサイエンティストとして様々な施策に携わりました2

Python

私が最も得意とするプログラミング言語です。

型アノテーションを利用して、保守性の高いプログラムを書くことができます。また、必要な場合にはメタプログラミングを活用して効率性の高いライブラリを開発することも可能です3 4

これまでに個人プロジェクトや一部の業務で開発したもののうち、一部はパッケージとして公開しています5

Data Engineering

HadoopやSparkといった分散処理基盤の上で、レコメンデーションなどの機械学習アルゴリズムを実装できます6

Luigi / Airflow / Prefectなどのワークフローエンジンを用いてデータの連携・変換や機械学習エンジンを動かすデータパイプラインを構築するプロジェクトに複数従事しました。

BigQueryを利用したデータ処理には長く携わっており、SQLでクエリを開発する以上の高度な仕事ができます。クエリの依存関係の自動解析7や、JavaScript/TypeScriptを利用して通常のSQLでは記述が不可能な複雑な処理をを行うUDFを実装するなど8、計算機科学・プログラミングの技術を活かして生産性高くデータ基盤を開発することができます。

その他

  • R: 2003年頃〜2010年頃までは、統計解析には主にRを用いていました。多変量回帰分析や、状態空間モデルによる時系列解析などを業務で利用した経験があります。
  • C++: 証券会社でクオンツとして、エキゾチックデリバティブのプライシングや、金利モデルのキャリブレーションのための社内ライブラリを開発・メンテナンスしていました。IBM Platform SymphonyというHPCフレームワークを用いて、粒子フィルタによる非線形状態空間モデルのデータ同化プログラムを開発した経験があります。

職歴

学歴

  • 2007: 東京大学大学院情報理工学系研究科数理情報学専攻修士課程終了
  • 2005: 東京大学工学部計数工学科数理コース卒業
  • 2000: 千葉県立東葛飾高等学校卒業
  1. 修士論文: Y. Horikoshi and A. Takemura. Implications of contrarian and one-sided strategies for the fair-coin game. Stochastic Processes and their Applications. Volume 118, Issue 11, November 2008, Pages 2125-2142 

  2. リクルート時代のインタビュー記事: リクルートのデータ分析を担う社員が語る、「修羅場に立ち向かった入社したての自分」と「今の自分」  

  3. メタプログラミングによってBigQueryのスキーマ情報から自動的にクラスを作るパッケージについての解説記事: Automatically Generate Type information from BigQuery schema 

  4. 上記パッケージで利用しているテクニックについての解説記事: Checking types and column names of a data frame with the schema information for BigQuery 

  5. PyPi上でのプロフィール情報: hotoku@pypi 

  6. 当時のプロジェクトでの知見を入門書に寄稿したもの: 初めてのSpark 

  7. クエリの依存関係を自動的に決定し、適切な順番で自動実行するコマンド: bqrun 

  8. BigQueryのUDFをTypeScriptで書く方法を解説した記事: 1 2 3