はじめに

このページでは『改訂新版前処理大全』R言語Tidyverseによるサンプルコードを公開しています。

また、本書ではサンプルデータがApache Parquet形式で提供されています。

本編では汎用性を考慮してこれを一般的なデータフレームに変換して扱っています。

しかし、これを arrow tableとして処理すると非常に高速な処理が可能になります。

以下のページではサンプルデータを arrow tableとして処理する方法について簡単に解説します。


事前準備

サンプルコードの実行に必要なパッケージ類は事前にインストールしておいてください。

以下のコードで必要なパッケージがインストールされます。

install.packages(c("tidyverse", "conflicted", "arrow"))

以上。