データサイエンスすいすい会29th
データサイエンスに関する雑談を通して、すいすいデータサイエンスを理解できるような知見を貯めていく『オンライン雑談会』
GRIの分析官リーダが主宰してテーマについてお話します
参加無料ですのでお気軽にご参加ください
参加方法
時間になりましたら、下記ZoomURLよりご自由にご参加ください
ZoomURL:
https://zoom.us/j/96152836275
ミーティング ID: 961 5283 6275
※参加無料
※Zoomミーティングにて行います
Zoomの表示名変更が必要な方は、入室の前に変更をお願いいたします
スケジュール
第29回 2022年4月13日(水)18:30~19:30
隔週で開催予定
内容
第29回「IoTセンサーデータのお手軽な予兆分析(時系列データの自動機械学習と自動特徴量作成)」
総務省の「令和元年版 情報通信白書(*1)」では、2020年代には約450億台のIoT機器がインターネットに接続されると予測しており、データ活用の可能性が拡大しています。一方、IoTで取得できるデータの多くを占めるセンサーデータは時系列データであり、超大規模な時系列データを人が効率的に理解できるようにするためには、技術力が必要な分野になります。
今回のすいすい会では、自動機械学習を用い、センサーデータを利用したイベント予測の初手をお伝えします。典型的なシナリオは、「ある特定のイベントの予兆としてセンサーデータに特定の波形が存在することを確かめたい」というものです。予兆の波形パターンが分かれば、あとはその予兆を検知し、様々な対応策を打つことができ、予兆からイベントの原因を推測することも可能な場合があります。一方、予兆の可能性のある波形のパターンは無数に考えられるため、それらのデータを大量に用意することは、自動機械学習を利用する際のボトルネックになります。このボトルネックを解消するために、センサーデータのような時系列の波形データに対する自動特徴量生成ライブラリtsfresh(*2)を使った一連の手順をご紹介します。
・センサーデータから得られる生データを用意
・tsfreshを利用して特徴量を自動生成
・自動生成された特徴量を自動機械学習(例:ForecastFlow)へ入れ予測モデルを構築
具体的な事例として、車が通過した地面の状態を加速度センサーのみで予測するタスクを紹介します。予測する地面の状態は「横断歩道」、「ロードマーカー」、「パンプ」、「道路のつぎはぎ」の 4種類です。tsfreshと ForecastFlowを組み合わせることで、初心者でも、簡単に、素早く予測を行うことができるということを実感していただければ幸いです。
(*1)https://www.soumu.go.jp/johotsusintokei/whitepaper/ja/r01/pdf/
(*2)https://tsfresh.readthedocs.io/en/latest/
ナビゲーター
氏名: 古幡征史
所属: 株式会社GRI 取締役
Ph.D in Computer Science
経歴: GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職
機械学習活用やデータサイエンスに関する
情報共有コミュニティ
〇ご自由にご参加いただけるSlackを用意しています
実践的に機械学習を活用するための議論やノウハウの共有を目的としています
すいすい会の内容についても活発に議論できればと思います
〇GRIのTwitterでもデータサイエンス関連の情報をつぶやいています
過去のすいすい会
過去のすいすい会のアーカイブはこちらからご覧いただけます