このページでは『改訂新版前処理大全』のR言語のTidyverseによるサンプルコードを公開しています。
また、本書ではサンプルデータがApache Parquet形式で提供されています。
本編では汎用性を考慮してこれを一般的なデータフレームに変換して扱っています。
しかし、これを arrow tableとして処理すると非常に高速な処理が可能になります。
以下のページではサンプルデータを arrow tableとして処理する方法について簡単に解説します。
サンプルコードの実行に必要なパッケージ類は事前にインストールしておいてください。
以下のコードで必要なパッケージがインストールされます。
install.packages(c("tidyverse", "conflicted", "arrow"))
以上。