ポアソン回帰でカウントデータを将来予測 (Ver. 3.18.2)
時系列データ分析ツール Node-AI スクラムマスターの 中野 です!
今回のアップデートでは、新たなAIモデルの一員としてポアソン回帰が追加されました!
ポアソン回帰はカウントデータと呼ばれるデータに対して有効です。
本記事では、カウントデータの例とポアソン回帰の適用例をご紹介します。
詳細な説明はマニュアルもご参照ください。
カウントデータの例
聞き慣れない用語ですが、何か特殊で難しい概念という訳ではありません。
以下のような「シェアサイクル利用台数予測」のチュートリアルで使用されるデータもカウントデータの一例です。

カウントデータとは、言ってしまえば「指で数えるようなデータ」です。
0から始まり、1、2、3、….と続きます。
はい、たったこれだけです。
ポアソン回帰モデル
自転車の利用された台数を数えるのに「マイナス2台」とか言いませんよね?
しかし、多くのAIモデルはそのことを考慮してくれません。
例えばチュートリアルでも使われているMLPモデルでは、予測結果がマイナス2台ということを平気で言ってきます。
実際に人間界でその予測結果を使うには、人間のルール(自転車の利用台数はカウントデータであるということ)で補正してあげる必要があります。そこをAIモデル自身が担保しているのがポアソン回帰モデルです。
実際にMLPとポアソン回帰モデルでの予測結果の違いを見てみましょう。
まずはMLPモデル

一部、マイナスになっている箇所もあります。
次にポアソン回帰


予測結果の全体を見渡しても、必ず0以上の値になっています!
いかがですか?
モデルは作ったものの「予測値がマイナスになって違和感がある」ようなことがあれば、ポアソン回帰をお試しください!
