効率的なデータ分析で有用な特徴を発見、システム化へ
Sky株式会社では、システム化の前段階であるデータ分析において、ドメイン知識を取り入れた有用な特徴量エンジニアリングを実施。AutoMLの活用などで効率的にデータ分析を行い、実効性の高いシステムの開発へつなげています。
実績紹介
データ分析・活用において、次のようなお悩みをよくお聞きします。
- データは集めたが、どのように分析すればいいのか?
- 現場の情報・知識・ノウハウを、どのように活用するのか?
- 検知・予測のモデルはどのように選定すればいいのか?
弊社では、「Microsoft Azure」や「Amazon Web Services」などクラウド上でのデータ収集はもちろん、センサーなどのエッジデバイスからもそれぞれの形式でデータを収集。各種ライブラリを活用して、データを最適に可視化します。
さらに、現場の声を引き出して、各ドメイン固有の情報・知識・ノウハウも分析内容に反映します。
このように、有用な特徴を抽出した上でAutoMLなどを活用し、効率的にデータ分析を実施します。
また、推論に使用するモデルも、機械学習を使わないルールベースの検討を含めて最適なものを選定。システム化に必要な精度向上、判断ルール策定を行います。
業務フロー
事例1ネットワーク監視(系統別トラフィック可視化例)
事例2異常検知(設備状態の時系列データ分析例)
活用している技術
- LSTM(時系列データ分析)
- GBDT(XGBoost、LightGBM、CatBoost)
- scikit-learn、AutoML(PyCaret)
- 可視化ライブラリ(Matplotlib、Plotly、SHAP)
- Amazon SageMaker
- Azure Machine Learning(統合データサイエンスソリューション)
- Apache Spark(ビッグデータ分散処理フレームワーク)