データサイエンス女子のゆるふわだいありー

データサイエンス女子のゆるふわだいありー

学んだことをゆるゆるアウトプットしていきたいです。

【Merpay x M3 x PFN 共催】Machine Learning Night に参加してきました

はじめに

本日2019/12/10(火)に行われた、【Merpay x M3 x PFN 共催】 Machine Learning Night に参加してきました。本勉強会は、Machine Learning Production Pitch*1 番外編です。

machine-learning-pitch.connpass.com

当日の様子は、Twitterハッシュタグ#mlppでもわかります。

LT

田中 龍亮さん (エムスリー株式会社)

資料

私のメモ
各発表に対して「私のメモ」という項目で書きますが、概要ではありません。文字通りメモです。

  • embeddingで情報を密にしてあげてる
  • 希少疾患・希少薬剤とかにグラフラプラシアン効く
  • タグ付の方と、両方が相互で良くなっていく

大垣 慶介さん (エムスリー株式会社)

資料

私のメモ

  • 10月入社で1つ目のプロダクト
  • アンケート分析して終わりじゃもったいない!!!
  • レコメンドとかパーソナライズに使いたい

  • 性格の計画が分かるタイプのアンケート

  • 予測できるというか傾向がつかめる、ログを使ってアンケート結果の予測ができる

www.m3tech.blog

所感
アンケートってみんなが答えてくれるわけではないし、アンケートのデータ取れるユーザだけ使うと「アンケートに答えるようなユーザ」のバイアスがかかってしまうので、確かに予測するのは良さそうだなと思いました!

本編

MerpayにおけるML活用のポイント 竹原 一彰さん @_zak3 (株式会社メルペイ)

資料
12/11時点では公開を確認できていません。

私のメモ

  • MLチーム 、8人
  • 課題発見からモデリング、マイクロサービスの提供まで
  • pjo*2-tl*3-em*4体制
  • Go言語
  • GCP縛り

メルペイ
今3年目、2019年2月にローンチ

  • メルカリスマート払い*5の与信枠は機械学習で決めている
  • AML (Anti-Money Laundering) マネーロンダリング対策
  • 疑わしい取引を検知して人がチェック

  • チームの3年ロードマップ

  • A4 2枚程度でミッション、取り組むべき重要案件

  • ソフトウェアエンジニアとして課題を解く

  • 精度の良いモデルだけでは不十分

  • Data Validation

  • 各マイクロサービスがアグレッシブに変えてしまう。モデル動かせなくて検知

  • 8人しかいないので解くべき課題にフォーカス

  • 相談された時に安易に受けない

  • 1-3ヶ月で1st version

  • 問題に適した技術

  • いきなりディープラーニングとかしない

  • レビュープロセス等いろいろ改善、ルールの追加だけでなくて廃止も

所感
解くべき課題にフォーカスすることを徹底されているのが特に素晴らしいと感じました!

Preferred Networksの顧客向けプロダクト開発 谷脇 大輔さん (株式会社Preferred Networks)

資料

私のメモ

  • 国内最大級のGPU!!

  • 今年からプロダクト開発チームができた!

  • 優れた研究成果を世に広めるために将来のスケーラビリティを考慮したアプリケーション開発を高品質かつ高速に行う

  • 顧客ごとにプロジェクトがある

  • インフラは本番環境は顧客ごと、devは共通だがアプリは分ける
  • プライバシー

  • アプリ、micro service

  • ドメインが同じ場合は、共通ロジックを再利用できる。マイクロサービスはいい
  • 研究者のjupyterのやつを上げるためにpythonの推論サーバ(言語依存内容に

  • 今までは研究で注目されてきたけど、それをどうやって活かしていくかというところを最近頑張っている、アプリケーションエンジニア採用中

preferred.jp

所感
元々研究でかなり成果を出していらっしゃるPFNさんが、研究を実際に活かしていくことにも最近は注力しているとのことなので、今後どんどんビジネスに活かしていかれるかと思うと楽しみです!

sansan紹介(Sansan株式会社 執行役員/CTO)

今月テック系のTwitterをはじめたみたいです! twitter.com

パネルディスカッション

モデレータ:藤倉成太さん(Sansan株式会社 執行役員/CTO) パネラー:谷脇 大輔さん(株式会社Preferred Networks), 西場 正浩さん(エムスリー株式会社) , 竹原 一彰さん(株式会社メルペイ)

Q 事業を形にできている成功している企業だと思うが、どう事業化に結びつけてきたのか?
PFN

  • 研究で成果ができたらどう活かしていこうか?ってなって企業とやる
  • 予算、費用を担保
  • 開発を続ける

メルペイ

  • データプラットフォームは初期初からあった
  • ビジネスのコアを見極めて提案するのはmLエンジニアから
  • お問い合わせは断りつつ、MLエンジニアから提案を徹底

M3

  • そもそもプロダクトからチームスタート
  • 2年半か3年前から。機械学習素人でルールベースとかから頑張った
  • ルールベースで他のとこがやってるのを横展開にするとすんなりいく

メルペイ

  • MLエンジニアは新しい物好きなのでほっとくとR&D的になってるから縛りは強くしている
  • 解釈性

Q PFNさんは事業化の道が見つからないことはあるのか?
PFN

  • ないわけじゃない
  • 共同研究先が大企業だから、大企業のやりたいことを研究するから闇雲にやってるわけではない

Q PFNさんに クライアントさんが先に問題設定してるってことはある?
PFN

  • 結構ある
  • プロダクト開発チームが早い段階で入って、もった方がいい観点をサポート

Q M3は?
M3

  • 今は目の前のできることを一個一個やる

Q どこまでカバーしますか?
M3

  • 障害起きたらMLエンジニアもいく 
  • サクッと作って出してるのでAPI落ちてカバーできなかった時は、何かしらフロントが表示してくれている
  • 晦日に出勤したこともある

メルペイ

  • フロントはしないが、バッチシステム
  • SLO*6を高くしすぎない
  • 夜間バッチをなくす、週次バッチ、など工夫

PFN

  • プロダクト開発チームが発足して早いので、24時間365日対応のプロダクトは今はない
  • AWS上でCICD、アプリ監視も自分たち
  • 運用はミッションではない、研究を世のニーズにマッチしていることを示す

Q コード書くとこまでやりたがるのか?採用とかの時にそこまでやりたくないって人もいるのか?
PFN

  • 研究系は本当に研究でアプリは一切やらないけど一点突破って感じの強い人、
  • プロダクト開発チームは機械学習に強い人はそこまでいない
  • キャッチアップは重要

メルペイ

  • 運の良いことに、モデルだけやりたいみたいな人はいない
  • 得手不得手はあるが、チームのアサインで工夫

  • モデルだけだと厳しい時がある、仕事がなくなってしまう

  • 採用時にマッチングを意識的にやっている
  • 会社ではビジネスコミットしてプライベートでは大学院とか

M3

  • 採用時にプロダクションコードまでやるって言ってて、チャレンジしたいならOK
  • docker作ってインフラにはdockerで渡す

Q ML系の周辺のサービスやツールは助けになってる?
メルペイ

  • 昔ほどネットワーク設定やサーバ構築からしなくていい
  • 専門性は必要だし難しいので補いながら

M3

PFN

  • モデルはリアルタイムに更新するのは今ない
  • AWS SageMaker*8とかは使ってない
  • モデルはS3にアップロードしてロードして使ってる

Q 課題
PFN

  • 解決しつつある課題
  • 推論サーバをどう作るか
  • 研究者がjupyterで描いたやつをプロダクションで使えるように

メルペイ

  • 与信枠、完全MLではない、ビジネスロジックでフィルター
  • うまい融合は難しい
  • 自動化の範囲を広げればいい?

M3

  • 解決すべき課題は正しいのか?

Q これからのチャレンジは?
M3

  • 新しいプロダクトの発見をグローバルにしたい
  • 医療に貢献したい、40兆円くらいを10兆円くらい減らしたい
  • ミッション高く仲間が欲しいかつ腕に自信がある人腕を磨いていきたい人と働きたい

メルペイ

  • 与信続ける
  • お金の流動性が上げていきたい
  • お金を滑らかにしている
  • 欲求を満たすような推薦、検索
  • MLは手段の一つでミッションを実現する人と働きたい

PFN

  • 新しい事業を作っていくフェーズ
  • 周りと協力しながら働く人
  • 専門分野以外のキャッチアップに会社が協力的
  • 特許・論文の勉強会も社内にある

sansan

  • まだ人力も結構ある
  • クラウドワーカーさん数十万人!!!

  • 100%ソフトウェアに可能なら変えたい、まだまだチャレンジの領域はある

  • 機械学習は、今までできなかったことをできるようにする領域

PFN

  • 研究で終わらず事業化していくか考えるのはチャレンジ

おわりに

各社のチームのこと、課題、どういった感じで仕事しているかを知ることができて良かったです。 懇親会も盛り上がって楽しかったです!ありがとうございました。

本イベントの、他の参加者の記事

tenajima.hatenablog.com

yhiss.hatenablog.com

過去に私が参加したMLPPの記事

kabayan55.hatenablog.com