投稿日:

PHPで統計処理を行うには

ビッグデータの活用がすっかり定着してきた昨今、どうデータを分析するかがとても大事になってきました。
PHPはWEBアプリケーション用言語ですので従来はデータ分析と言っても単にカテゴライズや平均を求める程度で需要は満たせましたが、今後は統計的な手法を用いてさらに突っ込んだ解析を行う場面も出てくるかと思います。
そんな時に使えるライブラリを紹介します。

そのライブラリとは、ズバリ、

PECL stats

PHPの拡張ライブラリとしてPECLをご存知の方も多いと思います。
PECL statsはその統計用ライブラリです。

具体的には以下のような関数が使えます。

PHPで使える統計関数

例えば相関係数を求めるくらいならプログラミングも比較的簡単ですが、その相関係数の検定を行う場合、t分布系の値を返してくれる関数があるのはかなりありがたいです。

ただ、残念なのは統計関係の関数はまだドキュメントの整備が進んでいないことですorz
ドキュメントが未整備の関数は、返す値の信頼度をパラメーターを変えながら自分で確かめていくしかないです(涙)

でも、いちから自分でプログラムするよりは断然楽なので、機会のある方はPECL statsの使用も検討されてみてはいかがでしょうか?☆