見出し画像

ポアソン回帰でカウントデータを将来予測 (Ver. 3.18.2)

時系列データ分析ツール Node-AI スクラムマスターの 中野 です!

今回のアップデートでは、新たなAIモデルの一員としてポアソン回帰が追加されました!

ポアソン回帰はカウントデータと呼ばれるデータに対して有効です。
本記事では、カウントデータの例とポアソン回帰の適用例をご紹介します。

詳細な説明はマニュアルもご参照ください。

カウントデータの例

聞き慣れない用語ですが、何か特殊で難しい概念という訳ではありません。

以下のような「シェアサイクル利用台数予測」のチュートリアルで使用されるデータもカウントデータの一例です。

カウントデータの例

カウントデータとは、言ってしまえば「指で数えるようなデータ」です。

0から始まり、1、2、3、….と続きます。
はい、たったこれだけです。

ポアソン回帰モデル

自転車の利用された台数を数えるのに「マイナス2台」とか言いませんよね?

しかし、多くのAIモデルはそのことを考慮してくれません。
例えばチュートリアルでも使われているMLPモデルでは、予測結果がマイナス2台ということを平気で言ってきます。

実際に人間界でその予測結果を使うには、人間のルール(自転車の利用台数はカウントデータであるということ)で補正してあげる必要があります。そこをAIモデル自身が担保しているのがポアソン回帰モデルです。

実際にMLPとポアソン回帰モデルでの予測結果の違いを見てみましょう。

まずはMLPモデル

MLPの予測結果

一部、マイナスになっている箇所もあります。
次にポアソン回帰

ポアソン回帰の予測結果
ポアソン回帰の予測結果(全体)

予測結果の全体を見渡しても、必ず0以上の値になっています!

いかがですか?
モデルは作ったものの「予測値がマイナスになって違和感がある」ようなことがあれば、ポアソン回帰をお試しください!