2018年5月31日

こんにちは。データセンター統括グループ(以下DC統括G)の朝比奈です。前回は社外で発表した「CFD解析を活用したデータセンターの最適化」についてご紹介しました。今回は統計的手法を用いたデータ分析についてご紹介したいと思います。 ところで皆さん、西内啓氏のベストセラー本「統計学が最強の学問である」はご存じでしょうか。統計学が最強と言われる理由は「客観的な指標で最善の一手を示せる」ためで、これをDC統括Gは、予実管理、効率改善の数値化、設備交換時期の予測に役立てています。今回は、電気料金の「予実管理」についてお話しします。

データ分析の流れですが、生産管理や品質管理などでお馴染みのPlan(計画)→ Do(実行)→ Check(評価)→ Action(改善)サイクルと同様に、まず収集したデータの洗い出を行い、帰無仮説(検定)などを立て予測を行います。そして予測と実績値の予実差異分析結果から軌道修正をかけ、経過をみていきます。

皆さんの会社でも予実管理を行っているかと思います。経営陣は事業計画を基に予算を立てます。予算と実績。予算に合わせることが各部署の目標となりますのでこの予実差異は小さい方がいいです。DC統括Gはデータセンターの運用・管理を行う部門でありますので、主にメンテナンス費用、設備購入費用、電気料金などの予算を立てます。定期的に発生するメンテナンス費用や規模の大きい設備は計画的に購入するため、比較的予算は立てやすいです。しかし、電気料金は使用電力量などが毎月変動し、また原価比重も高いため外れれば利益にも影響します。そこで、統計的手法を取り入れ電気料金を予測し予算の立案をします。

ここで使用電力量の変動要因を見てみたいと思います。

顧客が使用するサーバ使用量、空調電力量、受電電力、UPS電力量、外気温、機器の入替とさまざまな事柄が使用電力量の要因となります。また、データセンターの種類は、専用施設、混合施設、テナント型(DC in DC)とさまざまな種類があり、電気料金の契約も変わってきます。これらの契約形態に合わせて必要な計測データを収集し、データの洗い出しを行います。

基本統計量である平均値と最小値、最大値、ばらつきがわかる分散や標準偏差を算定後、表やグラフを作成し確認を行います。また、統計はデータが正規分布していることが前提条件であるため、ばらつきが視覚的にわかりやすいヒストグラムを作成し、正規分布しているかどうかの確認を行います。右上の散布図をごらんください。こちらは、ビル全体使用電力量とデータセンター使用電力量の散布図になります。X軸の値が大きくなればY軸の値も大きくなるといった右肩上がりのデータになります。これを「正の相関」があるといいます。またX軸の値とY軸の値の相関(影響を受けて関わりあっている)を数で表すことができ、0.8以上の場合に「強い相関がある」と言われています。この図の相関係数は、R=0.92と非常に強い相関になります。このようにしてデータの傾向を把握し、相関分析から電気料金の予測を行います。

統計分析を取り入れた結果、電気料金差異総額を年額1億2千万円→34万円までおさえることができました。また、毎月予実差異分析を行うことでロジカルに経営者や本部長に結果報告することができます。

今日はデータ分析についてほんの一部をご紹介いたしましたが、皆さんも統計学を取り入れてみたくなりませんでしたか?

本ブログの情報につきましては、自社の検証に基づいた結果からの情報提供であり、
品質保証を目的としたものではございません。