もじゃもじゃな人の雑記

当方は高専生でしたが今は腐れ大学生.今後は日記および備忘録として動きます.

点過程及びポアソン過程

昨日サボった分,長めの記事書きました.

思ったより筋肉痛になってなくて幸いですわ.明日以降にやって来るんだとしたらそれは知らない.

さて,タイトル通りポアソン過程とそれによって説明できる点過程の特徴について,今回は紹介したいと思います.


点過程とは(ざっくり)

時系列上において,イベントがランダムに発生していくシステムを点過程と呼び,そのイベントの発生規則は確率で記述される,らしい.参考に読んでいたのは[1].

語尾が怪しいのはすでにこの項目が難しそうだってちゃんと読んでないからですゴメンナサイ.

この説明はめっちゃ一般化してて普通に難しいやつでは?と思ったので今回は深入りしないことにします.書きたかったのは次のところから.



ポアソン過程

ポアソン過程(ポアソン点過程)も点過程の一部である.定義は次の通り(参考:[2]).なお単位時間あたりのイベントの発生確率を\lambdaとする.

  1. 希少性を持つ.すなわち,十分に短い時間にイベントが2回以上発生することはない.
  2. t秒後までにイベントが発生する回数N(t)ポアソン分布Po(\lambda t)に従う.
  3. イベントの発生間隔\tauが時間幅t以下となる確率はパラメータ\lambdaの指数分布に従う.

そして,そのイベント発生確率は次の性質を持つ(参考:[2][3]).

  • 定常性:各事象が発生する確率は時間によらず一定である.
  • 独立性:各事象は以前に発生した事象から影響を受けたりその次の事象に影響を与えたりしない(無記憶性).



性質から導出してみる

では今回は先ほど述べたポアソン過程の性質(と定義1)から本当にポアソン分布と指数分布が導出できるかどうかをやってみる.参考は[4]とか.

導出その1. 指数分布

ここではイベントの間隔tが指数分布に従うことを確かめることが目的である.

まずは,時刻0からtまでイベントが起こらず,時刻t+\delta tで初めてイベントが起こったと考える.ここで,\delta tの間にイベントが発生する確率は\lambda\delta tである.

次に,\delta ttを大きい数nで分割したものと考える.すると,時刻0からtまでn個ある各時間幅\delta tでは,全てイベント発生に失敗しているため,各々のイベント失敗確率(1-\lambda\delta t)を乗じて,時刻0からtまで失敗し続ける確率を(1-\lambda\delta t)^{n}とする.なお単純に乗じるだけで同時確率が求まっているのは独立性によるところである.

最後には成功するため,先ほどの確率に\lambda\delta tを乗じた(1-\lambda\delta t)^{n} \lambda\delta tが,時刻0からtまでイベントが起こらず,時刻t+\delta tで初めてイベントが起こった確率である.

同様に考えていくと,時刻tまでにイベントが起きる確率P(\tau\le t)は次のように書ける.

P(\tau\le t) \simeq \lambda\delta t + (1-\lambda\delta t)\lambda\delta t + \cdots + (1-\lambda\delta t)^{n-1}\lambda\delta t = \lambda\delta t\frac{1-(1-\lambda t/n)^{n}}{1-(1-\lambda \delta t)}

ここで\delta t\to 0の極限をとると,P(\tau\le t)=1-e^{\lambda t}が得られ,これが指数分布であると分かる.

なお,上では公式: \lim_{n\to\infty} \left(1+\frac{x}{n}\right)^{n}=e^{x}を用いている.

導出その2. ポアソン分布

今度は時間幅tの間にイベントが起こる回数N(t)ポアソン分布に従うことを示す.

先ほどと同様にtnに分割する.そのn個のうち,k個の時間幅でイベントが発生したとする.\delta t=t/nであるため,その確率P(N(t))は次のように表せる.

 P(N(t))=\frac{n!}{k!(n-k)!} \left(1-\frac{\lambda t}{n}\right)^{n-k} \left(\frac{\lambda t}{n}\right)^{k}

ここで, n!/(n-k)!\approx n^{k}という近似をとって, n\to\inftyという極限をとると次のようになる.

 P(N(t))=\lim_{n\to\infty} \frac{n^{k}}{k!} \left(1-\frac{\lambda t}{n}\right)^{n} \left(\frac{\lambda t / n}{1-\lambda t / n}\right)^{k} = \frac{1}{k!}e^{-\lambda t} (\lambda t)^{k}

tを1とすると,ポアソン分布 Po(\lambda)=\frac{\lambda^{k}}{k!} e^{-\lambda}が出てきた.一安心.



結び

というわけでただのポアソン過程の紹介と導出でした.

今回で注目して欲しいのは,ポアソン過程でイベント発生を説明する場合,無記憶性に合致するようなイベントでなくてはならないことです.

実はこれ,時々話題に出しているTwitterでのタグの出現等をイベントと捉えて予測をするときには,残念ながらうまく当てはまらないらしいです(すみません,そう聞いたことがあるんですが決定的なソースを探し中です).

そこで最近代わりに使われるのがHawkes過程らしいんですね.

そういうわけで今回の記事は,自己励起現象の予測という点においては,実はHawkes過程への導入だったというわけです.

Hawkes過程についてはまた調べて書きます.

参考文献

  1. Lectures on the Poisson Process, Gunter Last and Mathew Penrose, http://www.math.kit.edu/stoch/~last/seite/lectures_on_the_poisson_process/media/lastpenrose2017.pdf
  2. Queueing Theory, J. Virtamo, https://www.netlab.tkk.fi/opetus/s383143/kalvot/E_poisson.pdf
  3. ポアソン過程,TauStation,http://taustation.com/poisson-process/
  4. ポアソン過程の到着間隔~指数分布,TauStation,http://taustation.com/poisson-process-exponential-distribution/