データサイエンスすいすい会 7th
データサイエンスに関する雑談を通して、すいすいデータサイエンスを理解できるような知見を貯めていく『オンライン雑談会』
GRIの分析官リーダが主宰してテーマについてお話します
参加無料、お昼を食べながらお気軽にご参加ください
参加方法
以下のURLからzoomでの参加が可能です
https://zoom.us/j/96152836275
参加無料
時間になりましたらご自由にご参加ください
スケジュール
第7回 2020年11月25日(水)12:00~13:00
隔週で開催予定
内容
第7回「時系列のセンサーデータを扱ったPredictive Modelでの予測について」
ビジネスシーンで扱うデータの多くは時系列データであり、予測に関して、数多くのモデルが存在します。今回は、NASAの研究の一つである飛行機のタービンエンジン機器のセンサーデータを用いて、故障予測をする話を中心にします。さらに、時系列データを扱った予測手法における、Predictive ModelとTime-Series Forecastingの違いを解説します。時系列データはデータの扱いが大変なため、MIT(マサチューセッツ工科大)で開発された自動特徴量生成ツールであるFeaturetoolsを紹介します(現在はAlteryxに買収されています)。
– 時系列データとは
– Time-Series ForecastingとPredictive Modelでの予測の違いについて
– Featuretoolsを用いた時系列データの前処理について
– 飛行機のタービンエンジン機器のセンサーデータを用いて、故障予測
ナビゲーター
古幡 征史
株式会社GRI 取締役
Ph.D in Computer Science
GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職
機械学習活用やデータサイエンスに関する
情報共有コミュニティ
自由にご参加いただけるSlackを用意しています
実践的に機械学習を活用するための議論やノウハウの共有を目的としています
すいすい会の内容についても活発に議論できればと思います
Slackはこちら
過去のすいすい会
第6回「予測スコアを用いた効果的な施策実施」
自動機械学習ForecastFlowを使うと、顧客一人一人のレベルで予測スコアを自動で算出できるようになります。これからの出来事が予測できるので、効率的に施策を実施することができます。その実行手順や考え方を説明します。
– 推論(予測スコアの算出)の考え方
– 予測スコアの施策選定への活かし方
– 予測スコアの算出から可視化までの自動化のやり方(Tableau PrepのTabpy連携)
– ELTツールMatillionを利用したBigQueryとForecastFlowの自動連携のやり方
– ForecastFlowの機能追加の紹介(Sensitivity Analysis (Partial Dependence Plot) の探索機能追加)
資料はこちら↓
第5回「ForecastFlowで自動機械学習をやってみよう」
自動機械学習の仕事の進め方をForecastFlowのデモ(分類問題と回帰問題)を通して紹介しました。このデモは幕張で開催された「AI・業務自動化 展」より生放送でお送りしました。
第4回「自動機械学習での特徴量の作り方」
自動機械学習の工程の中で最も時間を要するのが予測ターゲットを説明する特徴量データの準備になります。特徴量の考え方、アンチパターン、モダンなアルゴリズムで不要な特徴量処理をお話しました。また、Tableauなどの可視化ツールで事前に分析しておくべきことと自動機械学習での特徴量エンジニアリングの使いどころをお伝えしました。
資料はこちら↓
第3回「機械学習の初心者卒業: 分類問題の精度評価手法と不均衡データの実践的な取り扱い」
実社会では不均衡データを扱うのが普通ですが、教科書ではあまり触れられていないため、今回は不均衡データの実践的な取り扱い方をお話します。その際、Google ColaboratoryやTableau Prepでの実装例をご紹介します。また、不均衡データの取り扱いを理解する前提知識として正解率のパラドクスや精度評価方法を述べます。
資料はこちら↓
【イントロダクション】初心者突破①:精度評価と不均衡データの扱い
第2回「アンケートと機械学習で効率的な顧客理解の実践方法の共有」
アンケート回収数が少なくアンケート結果が眠っている企業も多いのではないでしょうか?
今回の「すいすい会」では、アンケートと機械学習の組み合わせの事例を紹介しました
QA追加回答
当日いただいたご質問への回答内容を追加いたします
Q. アンケートの内容そのものの妥当性はどのように検証するのでしょうか?
A. コンバージョンが、すぐに決まる商材であれば、コンバージョンを教師にして、設問を含めた特徴量で機械学習。設問が重要特徴量に入ってくれば、良い設問だったと言える
資料はこちら↓
【イントロダクション】アンケートと機械学習で効率的な顧客理解の実践方法の共有20200916
第1回「ビジネスでAIを上手く活用するための問題設定法の共有」
AIを実践的に活用する際、どのような問題を設定すべきか?
AIで解くべき問題が分かると、実践的なデータ利活用ができます
第1回では、サブスクリプション・ビジネス(解約防止、Life-Time Valueの予測)における問題設定の秘訣を話しました
資料はこちら↓