Webサービスのデータのエコシステム

Who am I?  

  • 竹野峻輔 (@takegue):  Retty株式会社
  • NLP(MT)  → Data App. / Analyst → Data Eng. → now

  • Data Architect
  • Core Value: 
  • データの価値を最大限に活かすための仕組み/設計を考え実現すること
  •  e.g.  ロジック開発、SQLでTDD、プロダクトのログ基盤  …
  • 収集〜活用まで一気通貫で開発
  • 簡単に回るようにスタックを削ったりしてます




今日 お話し(お聞き)したいテーマ

  • みんなデータのエコシステムのデザインってどうしてる?
  • MLエンジニアとしての技術領域とは?

toC(Webサービス)企業としての機械学習の悩み


  • 社会実装としての悩み
  • ユーザにとって良いもの、MLとしても面白いもの 重ねる努力がいる
  • 論文として考慮外の制約
  • 論文(ひとつのことをうまくやる) ←→ プロダクト(だいたいの事をそこそこやる+α)
  • プロダクトとしてのジレンマ
  • インパクトを広く取ろうとすると、結果全体の品質の保守が難しくなる
  • データに存在する潜在的なバイアスや予期しない事例に振り回せされる可能性も高い
  • インパクトを狭くsi影響範囲が小さいとMLがいらなくなる?
  • MLのためにMLを使うことにもなる … ? 
  • 複数のMLのモデルが作られる前提になる → 保守運用つらい
  • プロダクトとしてのMLの共存
  • 外注的に取り組むとコントロールできる幅も狭くなる…
  • 賞味期限切れるたびにMLのモデルを作り直す
  • かといって、MLは専門知識がないとコントロールもできない
  • 撤退ラインの判断


あーむずかしい😣




RettyでのキャッチコピーPJの例からの学び