昨日サボった分,長めの記事書きました.
思ったより筋肉痛になってなくて幸いですわ.明日以降にやって来るんだとしたらそれは知らない.
さて,タイトル通りポアソン過程とそれによって説明できる点過程の特徴について,今回は紹介したいと思います.
点過程とは(ざっくり)
時系列上において,イベントがランダムに発生していくシステムを点過程と呼び,そのイベントの発生規則は確率で記述される,らしい.参考に読んでいたのは[1].
語尾が怪しいのはすでにこの項目が難しそうだってちゃんと読んでないからですゴメンナサイ.
この説明はめっちゃ一般化してて普通に難しいやつでは?と思ったので今回は深入りしないことにします.書きたかったのは次のところから.
ポアソン過程
ポアソン過程(ポアソン点過程)も点過程の一部である.定義は次の通り(参考:[2]).なお単位時間あたりのイベントの発生確率をとする.
- 希少性を持つ.すなわち,十分に短い時間にイベントが2回以上発生することはない.
- 秒後までにイベントが発生する回数はポアソン分布に従う.
- イベントの発生間隔が時間幅以下となる確率はパラメータの指数分布に従う.
そして,そのイベント発生確率は次の性質を持つ(参考:[2][3]).
- 定常性:各事象が発生する確率は時間によらず一定である.
- 独立性:各事象は以前に発生した事象から影響を受けたりその次の事象に影響を与えたりしない(無記憶性).
性質から導出してみる
では今回は先ほど述べたポアソン過程の性質(と定義1)から本当にポアソン分布と指数分布が導出できるかどうかをやってみる.参考は[4]とか.
導出その1. 指数分布
ここではイベントの間隔が指数分布に従うことを確かめることが目的である.
まずは,時刻0からまでイベントが起こらず,時刻で初めてイベントが起こったと考える.ここで,の間にイベントが発生する確率はである.
次に,がを大きい数で分割したものと考える.すると,時刻0からまで個ある各時間幅では,全てイベント発生に失敗しているため,各々のイベント失敗確率を乗じて,時刻0からまで失敗し続ける確率をとする.なお単純に乗じるだけで同時確率が求まっているのは独立性によるところである.
最後には成功するため,先ほどの確率にを乗じたが,時刻0からまでイベントが起こらず,時刻で初めてイベントが起こった確率である.
同様に考えていくと,時刻までにイベントが起きる確率は次のように書ける.
ここでの極限をとると,が得られ,これが指数分布であると分かる.
なお,上では公式:を用いている.
導出その2. ポアソン分布
今度は時間幅の間にイベントが起こる回数がポアソン分布に従うことを示す.
先ほどと同様にをに分割する.その個のうち,個の時間幅でイベントが発生したとする.であるため,その確率は次のように表せる.
ここで,という近似をとって,という極限をとると次のようになる.
を1とすると,ポアソン分布が出てきた.一安心.
結び
というわけでただのポアソン過程の紹介と導出でした.
今回で注目して欲しいのは,ポアソン過程でイベント発生を説明する場合,無記憶性に合致するようなイベントでなくてはならないことです.
実はこれ,時々話題に出しているTwitterでのタグの出現等をイベントと捉えて予測をするときには,残念ながらうまく当てはまらないらしいです(すみません,そう聞いたことがあるんですが決定的なソースを探し中です).
そこで最近代わりに使われるのがHawkes過程らしいんですね.
そういうわけで今回の記事は,自己励起現象の予測という点においては,実はHawkes過程への導入だったというわけです.
Hawkes過程についてはまた調べて書きます.
参考文献
- Lectures on the Poisson Process, Gunter Last and Mathew Penrose, http://www.math.kit.edu/stoch/~last/seite/lectures_on_the_poisson_process/media/lastpenrose2017.pdf
- Queueing Theory, J. Virtamo, https://www.netlab.tkk.fi/opetus/s383143/kalvot/E_poisson.pdf
- ポアソン過程,TauStation,http://taustation.com/poisson-process/
- ポアソン過程の到着間隔~指数分布,TauStation,http://taustation.com/poisson-process-exponential-distribution/