1. HOME
  2. イベント
  3. すいすい会
  4. 【データサイエンスが理解できる】すいすい会 4th

【データサイエンスが理解できる】すいすい会 4th

データサイエンスに関する雑談を通して、すいすいデータサイエンスを理解できるような知見を貯めていく『オンライン雑談会』

GRIの分析官リーダが主宰してテーマについてお話します
参加無料、お昼を食べながらお気軽にご参加ください

参加方法

以下のURLからzoomでの参加が可能です
https://zoom.us/j/96152836275

参加無料
時間になりましたらご自由にご参加ください

スケジュール

第4回 2020年10月14日(水)12:00~13:00
隔週で開催予定

テーマ

第4回「自動機械学習での特徴量の作り方」

自動機械学習の工程の中で最も時間を要するのが予測ターゲットを説明する特徴量データの準備になります。エンジニアリングです。ここでは、特徴量の考え方、アンチパターン、モダンなアルゴリズムで不要な特徴量処理をお話します。また、Tableauなどの可視化ツールで事前に分析しておくべきことと自動機械学習での特徴量エンジニアリングの使いどころをお伝えします。さらに、特徴量エンジニアリングで使うべきツールは以前お話をいたしましたが、Python, R, Tableau Prep, Alteryx, Talend, Matillionの違いをさらっと眺めます。

– 特徴量エンジニアリングの基本形

– 特徴量のアンチパターン

– ForecastFlowで不要な特徴量エンジニアリングのリスト

– Tableauと自動機械学習での特徴量エンジニアリングの切り分け

– 特徴量エンジニアリングのおすすめツール

ナビゲーター

古幡 征史

株式会社GRI 取締役
Ph.D in Computer Science
GRIにて50以上のAI, BI, 分析基盤構築プロジェクトをリード
KPMGコンサルティング、University of Southern California、ドワンゴを経て、2016年9月より現職

機械学習活用やデータサイエンスに関する
情報共有コミュニティ

自由にご参加いただけるSlackを用意しています
実践的に機械学習を活用するための議論やノウハウの共有を目的としています
すいすい会の内容についても活発に議論できればと思います
Slackはこちら

過去のすいすい会

第3回「機械学習の初心者卒業: 分類問題の精度評価手法と不均衡データの実践的な取り扱い」

実社会では不均衡データを扱うのが普通ですが、教科書ではあまり触れられていないため、今回は不均衡データの実践的な取り扱い方をお話します。その際、Google ColaboratoryやTableau Prepでの実装例をご紹介します。また、不均衡データの取り扱いを理解する前提知識として正解率のパラドクスや精度評価方法を述べます。

資料はこちら↓

【イントロダクション】初心者突破①:精度評価と不均衡データの扱い

第2回「アンケートと機械学習で効率的な顧客理解の実践方法の共有」
アンケート回収数が少なくアンケート結果が眠っている企業も多いのではないでしょうか?
今回の「すいすい会」では、アンケートと機械学習の組み合わせの事例を紹介しました

QA追加回答

当日いただいたご質問への回答内容を追加いたします
Q. アンケートの内容そのものの妥当性はどのように検証するのでしょうか?
A. コンバージョンが、すぐに決まる商材であれば、コンバージョンを教師にして、設問を含めた特徴量で機械学習。設問が重要特徴量に入ってくれば、良い設問だったと言える

資料はこちら↓

【イントロダクション】アンケートと機械学習で効率的な顧客理解の実践方法の共有20200916

第1回「ビジネスでAIを上手く活用するための問題設定法の共有」

AIを実践的に活用する際、どのような問題を設定すべきか?
AIで解くべき問題が分かると、実践的なデータ利活用ができます
第1回では、サブスクリプション・ビジネス(解約防止、Life-Time Valueの予測)における問題設定の秘訣を話しました

資料はこちら↓

【イントロダクション】ビジネスでAIを上手く活用するための問題設定法の共有20200902

| すいすい会