かばやん's だいありー

かばやん's だいありー

学んだことをゆるゆるアウトプットしていきたいです。

推し本『現場の「ズレ」を解消するコミュニケーションメソッド』と出会ってからの私

はじめに

この記事は「【推し祭り】技術書典で出会った良書 Advent Calendar 2019 」 の2日目の記事です。 タイトルの通り、『現場の「ズレ」を解消するコミュニケーションメソッド』について書きます。

adventar.org

今年購入した技術同人誌

技術書典は6と7、両方行きました!
以下に今年購入した技術同人誌全てを載せます。 買った技術書は全て読んだので、積ん読無しです!!
推しの1冊を選ぶのは結構迷いました。読みなおした回数の多さで決めました。

技術書典6

技術書典7

BOOTHで購入した技術同人誌

『現場の「ズレ」を解消するコミュニケーションメソッド』はどういう本?

この本は、マネージャー(部長など)とメンバーとの現場に焦点をあて、メンバー側とどういった「ズレ」が発生しているかの原因と、「どういったアプローチがあるか」を書いた本となります。
(『現場の「ズレ」を解消するコミュニケーションメソッド』はじめに より引用)

構成は、現場あるある(困りごと)、原因観点リスト(どう解決するか)、メンバーへのチェックリスト、原因観点リスト説明、失敗しがちな判断、コラム、もっと深めたい方への紹介、となっています。

BOOTHで買うことができます。

Twitterハッシュタグ#ズレコミュ で他の人の感想も見れます。

本書との出会い

技術書典6で見かけて購入しました。この日は、元々は業務(機械学習)に関係ある本のみ買う予定だったのですが、タイトルを見て、当時の自分にとって必要だと感じたので購入しました。ちょうどプロジェクトもチームも新しくなり、良いチームにしていきたいという意思を強く持っていた時期でした。 即買いしたかというとそうでもなくて、表紙に「マネージャーのための」とあったので、私マネージャーじゃないしな......と少し迷いました。見本誌を手にとって、対象読者の項目に、「マネージャー、部長のみなさんをメインターゲットとしていますが、メンバー側からなぜすれ違うのかを見ていただく上でも参考になるのではないかと考えます。」とあったので、購入を決意しました。実際、メンバー側から見ても役立つ本だと今思っているので、購入を決めた当時の私に拍手を送りたいです。

本書を1回目に読んだ時の感想

実際に本書を読んで、仕事にどう活かせたか

1回目に読んだ時期の私自身の状況

  • 私はマネジメントをする側ではない
  • 新しいプロジェクト、新しいチーム、新しいチームのリーダーと 1 on 1 ミーティング開始
  • 1 on 1 ミーティング の議題を出すのは基本的にメンバー側だと思うが、何の話をしていいのか悩む
  • 自分のスキルアップのために 1 on 1 ミーティング を有効活用したいという意思はある
  • チーム内に「ズレ」があることは認識しているが、何をどう改善していくべきかはわからない状況
  • 報連相は完璧にこなしていると思っていたが、実はできていないかもと気づき始めた時期

メンバーとしての本書の使い方(私の場合)

  1. 自分が置かれている状況に近い「現場あるある」を探す
  2. 「原因観点リスト」を確認
  3. 「メンバーへのチェックポイント」にある質問に自分で答えてみる
  4. 必要であれば、回答にあたる部分をマネージャーに伝える

1 on 1 ミーティングでやったこと

1 on 1 ミーティングは自分自身のスキルアップの機会にしたいと考えて様々なトピックの話をしますが、本書に関係する部分はチームワークのスキルだと思っています。 「ズレ」を解消するために、自分の現状を伝えた上でフィードバックをもらい、不定期に 1 on 1 ミーティング中に同じ話題を出して改善しているかをトラッキングしてもらいました。

例)

  • 初回の1 on 1 ミーティングで、自分が相談と質問が苦手かもしれないと伝えた
  • 「相談フォーマット」にそってやってみようと考えているという話をした
  • 相談/質問すべき時にできていなかったり、相談/質問の仕方が下手だったりする場合には、率直なフィードバックをしてほしいとお願いした

日々心がけたこと

  • 本書p.17にある相談フォーマットを仕事用ノートの1ページ目に書いて、それに沿って説明できるようにしてから相談するようになった
  • 相談や質問の回数を増やすように心がけた

約半年でどうなったか

  • タスクの手戻りが以前より減った

おわりに

私自身は、良いチームを作るのは、マネージャーの努力ももちろんあるとは思うのですが、チームメンバー全員の気持ちも大切だと思っています。本書の「メンバーへのチェックポイント」がたくさんあるのを見て、マネージャーに逐一質問させるのではなく、聞かれる前にメンバー側から伝えることで、マネージャーの負担を減らせるのではないかと考えて、この半年行動してきました。マネージャーかメンバーか関係なく、良いチームを作りたいと考える人たちが、一人でも多く『現場の「ズレ」を解消するコミュニケーションメソッド』を手にとって良いチームが増えたら良いなと思って本書を推させていただきました。ぜひ読んでください!

「落合陽一が今、20代エンジニアに伝えたいこと」に参加してきました

はじめに

本日2019/10/30(水)に行われた、「落合陽一が今、20代エンジニアに伝えたいこと 〜エンジニアは、テクノロジーとどう向き合っていくべきか?〜」というイベントに参加してきました。

supporterzcolab.com

当日の様子は、Twitterハッシュタグ#sptzcolabでもわかります。

Q&A 前半

・飲み会誘われたときどう断っているか?
飲み会誘われてもそもそもカレンダー埋まっている、23時からとかなら参加できる

・睡眠時間は?
4時間くらい

・エンジニアとして掛け算しておもしろいことは?

https://cdn-blog.adafruit.com/uploads/2016/03/neri-oxman-cycle.jpg

www.keidanrensdgs.com

諸外国の諸問題とか? どの問題を誰が解決するか、ケーススタディの方が興味ある

シリコンバレー
創業した会社はアメリカだけど、基本日本 ラボは国際会議しか出さない

・結婚の決め手は?
考え方が違うところ

自己紹介

研究室 digitalnature.slis.tsukuba.ac.jp

アートティストとしては、今年は日本で個展を3回

書籍で一番のオススメは『魔法の世紀』。 books.rakuten.co.jp

Note note.mu

サロン lounge.dmm.com

公式YouTubeチャンネルはあるが動画はない t.co

Q&A 後半

・デスクトップの背景気にになる キルラキルの元になったフォント(ラグランパンチ)
fontworks.co.jp

・エンジニアの向き不向きはありますか?修行ですか?
視点をどこにおくかは重要

・自分が本当に好きなものを突き詰める前に、将来が不安だからと、エンジニアになるための技術的な部分をまず詰め込んで置こうとすることは危険ですか?
どの領域に興味があるかを手を動かしたほうがいいかも

・今22才だったら何をしますか?
国外の大学で博士を取る エンジニアとして生きていくのに専門性があるやつ Deeplearningとか流行りのものではないもの

・英語を話せないエンジニアの仕事はなくなると思いますか?
結構なくなると思うけど、流暢でなくても大丈夫だと思う コミュニケーションはできた方がいいと思う 逆はある、海外の人が全て日本語を翻訳している人もいる

・20代に戻ったら何に注力するか?
漁業 イルカと対話したい、海の上で過ごしたい

・落合さんの夢は?
ロードマップははっきりしている 研究だと何年に何をするか決めてる

どうやって人間自身がエンジニアリングを使えるようになるか?

・日常的に見るネットメディアは?
BBCとCNNのTwitter

スマホの次はARグラス?
スマホで解決できる課題がたくさんあるからまだスマホ

・月の読書量はどのくらいですか?
1日1冊、月30冊

・大学院にいくメリットは?
全員行って欲しい、博士までとって欲しい 専門性に軸足がないエンジニアは簡単にリプレイスされるから

・とてもお忙しいと思うのですが、普段どうやって知識を増やしたりスキルを上げたりなさっていますか?
なるべく人にあった時に聞く サーベイや査読 arXivdeep learningの論文は最近は話題になったものしか読んでいない

・好きなフロントエンドの言語は?
JS Python, Go

・今学んだ方がいいこと
習慣が重要。 研究の定例ミーティングを入れることから始めた

コンピュータサイエンス学んだ方がいいのか?
潰しが効くとは採用の人には思われるけど、スーパーエンジニアとしてどうかというと......

・時間を無駄にせず、効率よく動くために工夫してることはありますか?
タクシーで移動

・最先端の技術はどうやって学んでいますか?
研究論文

・なぜ研究者と起業家を双方志して、どういうことをされてきたのでしょうか。比較的近い年代でかつ同業界に今いますが、大きいプロジェクトを少人数で3つ回すと気がつけば時間が溶けていきます。何を心がけ普段行動されてるでしょうか
予定に隙を作らないこと

・20代のエンジニアに期待することはなんですか?
すぐ作る、言われる前に作るくらいでいい

・ビジネスとテクノロジー、どちらのほうが好きですか?あるいは、どちらのほうが向いていると思いますか?
どっちも好き

・エンジニアにポートフォリオは必要?
必要

・遅寝早起きのコツは?
45分起きに3台でアラーム

・20代エンジニアに伝えたいこと
20代のはじめから、具体的に何をしていかロードマップ作れるといいと思う 数値目標、何やるか 14歳の頃から予定表をかなり細かく作っていた

所感

ほぼQ&Aで、Slidoの質問に答えていただく形式でした。 かなりのスピード感で、検索や過去資料を用いながらたくさんの質問に答えていただきました。この記事に書いてあるのは一部で、お忙しい中予定より30分も長く講演してくださいました。 落合陽一氏の書籍は何冊か読んできましたが、講演を聴くのは初めてだったので大変良い機会でした!

本イベントの、他の参加者の記事・まとめ

lemonpasta.hatenadiary.com gunchari.hatenablog.com twitdoc.com note.mu

Machine Learning Production Pitch #4 x ML@Loft #6 に参加してきました

はじめに

2019/9/20(金) に行われた、Machine Learning Production Pitch #4 x ML@Loft #6 に参加してきました。

mlloft6.splashthat.com

machine-learning-pitch.connpass.com

当日の様子は、Twitterハッシュタグ#MLPP#MLLoft でもわかります。

togetter.com

今回は、Machine Learning Production Pitch と ML@Loft との共催とのことでしたが、私は初参加でした!

本編

富士通研の時系列データ解析技術 梅田 裕平 氏 (株式会社富士通研究所)

資料

drive.google.com

私のメモ
各LTに対して「私のメモ」という項目で書きますが、概要ではありません。文字通りメモです。

所感
富士通研の方のお話をうかがう機会はほぼないので(初めてかも?)、とても新鮮でした! 天の声が聞こえて時系列データの方へ行ったのがすごいと思いました!

ゼロベースからの論文レコメンドシステムの構築 河合 俊典 氏 (エムスリー株式会社)

資料

私のメモ

  • エムスリー株式会社
    • エンジニアが80人くらい
    • 医療の不自由なとこをなんとかする
    • お医者さん7-8割の人が使っている
  • CIWorks
    • 医師限定のサービス
    • arXivTimes の医療版的なやつ
  • 論文のレコメンド
    • 2ヶ月前に「特にデータも評価も決まってないけど作って!」
  • 分野の重なりが多い
    • 合併症の範囲が広い
    • 希少疾患
    • ワードの揺れ
      • MR 5個くらいある!しんどそう
    1. 医師と論文の名寄せ
    2. ジャーナルごとに形式違ったりする
    3. 同姓同名いる
    4. unique id を振る
    1. 興味ワードの生成
    2. TF-IDFで医療用語タグ付け
    3. Label propagation
  • Elasticsearch
    • WAND(Week AND)検索
  • Content-Based Citation Recommendation
    • 糖尿病 ← 5割くらいの論文に出てくる
    • 引用、abstract、著者とかを使う
    • これでコールドスタート問題を解決
  • 2つのモデルで、最後にマージ
  • 評価は編集部の目視を基準にアドバイスをもらいつつモデル化
  • 引用数の遷移を評価指標、時系列

所感
エムスリー株式会社が想像以上に多くのサービスを提供していること、また医療従事者の7-8割が使っているというのがまず驚きでした。
特にデータも評価も決まってない状態から、2ヶ月でお一人でこれだけのしっかりとした推薦のシステムを作られたとのことなので、本当にすごい以外の言葉が出てきません。
医療分野でのNLP特有の問題も知れて面白かったです。
あと、gokart 気になります。

社内の XX に詳しい人を知りたい 押条 祐哉 氏 (ストックマーク株式会社)

資料

私のメモ

  • ストックマーク株式会社 stockmark.ai

  • BERTやELMoの日本語モデルの配布などもしている

stockmark.ai

stockmark.ai

  • Anews
    • ビジネスニュース配信
    • チームの人が読んだ記事も読める
    • コメント機能あり
    • チームの共通知のアップデート!
  • 特定のキーワードやニュースで検索した時に、その分野に詳しい社内の人を推薦するエンジンを実装した stockmark.ai

  • 使うデータは、text (本文、記事タイトル、URL) とテーブル(ユーザ情報、ユーザアクションのログ、記事のメタデータ

  • コンテンツーベースでやった
    • 別用途で使用していたユーザベクトルがあった
  • ユーザベクトルと記事ベクトルのcos類似度
  • 記事ベクトル
    • 各記事のタイトルと最初の導入部分の名詞数単語をfastTextでベクトル化
  • バッチ処理とオンライン処理
  • 課題
    • コールドユーザは?
    • 他にも取れるデータで有効なものを探す
    • 評価指標
      • ABテスト、オンラインテスト

所感
ストックマーク株式会社の方の発表を聴くのは初めてで、前からどんな事されてるか気になってはいたので良い機会でした! かなりの短期間で実装されたとのことなので、使えるもの(既存のユーザベクトル)を使ってたり、記事ベクトルを作る時にタイトル+α だけ使ってたり、といった部分に機能としてスピーディーにリリースする工夫を感じました。 今後データどう変えるのかとか手法自体を変えるのかとか、評価どうするのかとか、色々気になるので、個人的にはまた発表聴けたら嬉しいなと思いました。

ESG評価を支える自然言語処理基盤の構築 久保 隆宏 氏 (TIS株式会社)

資料

私のメモ

  • ESG(Environment, Social, Governance)
  • 評価機関が複数あり、各評価機関のスコアに相関がない(本当に全然ない!)
  • 数十から百ページ、マンパワーでやるの大変 → NLP
  • 文書データの収集
    • AWSによる収集基盤構築
    • 作成したデータ5年分を近日無償公開するらしい
    • 企業がどういうことを書いてると株が上がったりするかみたいなのがわかる!
  • 評価対象となる文・段落の絞り込み
  • 課題
    • 各社各様の場所・仕様で公開しており集めにくい、解析しにくい
    • ESG評価、見た目は関係ないので綺麗なのより解析しやすいのを書いて欲しい
    • 自社内にデータなければ端正にデータを集めることがスタート地点?
    • 営業とフロントもインフラもやった!

所感
私自身にとってはあまり馴染みのないESG評価の話でした。かなり地道な努力をして取り組まれていていらっしゃったのが伝わってきました。

ディスカッション

普段は参加者も交えたディスカッションをしているそうなのですが、今回はLT登壇者の方々のパネルディスカッションでした。 Slido の質問に答えていただく形の進行でした。

TDA for time-series 興味深いです。 SARIMAなどの古典的手法、LSTMなどの深層系列モデルなどと比較したときの利点・欠点などをお伺いしたいです。

梅田さん

  • 予測というよりは分類とかに使う

MLチームの開発方法論って確立してきてますか?もしくは皆さんのチームはどうされてますか?

押条さん

  • ストックマークだと40人中5,6,人がMLで3サービスくらい
  • 個々人で責任持ってやる

河合さん

  • 再現性とか(パラメタとっとかないといけないよね)とか議論決行されてるし確立できてきた
  • Jupyterからそのままデプロイの会社もある。pipelineのossもあるし。ベストプラクティスは場合によるので難しい

梅田さん

  • 個人による?仕組み化したい

久保さん

  • 方法論の文脈によって違う。社内のデータ活用、jupyterの管理ノウハウ、プロダクトに入れる、MLopsをいかに早くするか

どこまでプロダクト寄りのことをすべきか?

久保さん

  • 全部やるメリットは何がいいのかわかる

梅田さん

  • 一人でやると回らないことも、企業による。

  • 一人でやった方が理想どうりにはなると思うけど、得意不得意もあるので分業でもいいかも。

河合さん

  • ヤフーは全部別
  • エムスリーだとデプロイもやるし、問題あれば営業巻き込んで解決、アラート出たら自分で解決。

押条さん

  • エンジニアが20人もいないとこで分業だと回らない。インフラ、バックエンド、フロントエンドとか分かれてる。API化してデプロイするところまではやっている。会社で決められてるならどうにもならないのでは?

研究成果の事業貢献は?

梅田さん

  • 結構PoCを長々やってしまう。課題を感じている、なかなか事業貢献できない

ML系アルゴリズムをオンラインテスト(A/Bテスト)に乗せるかどうかの判断をどのようにしていますか? to みなさん

河合さん

  • ABテスト大好き!目的を一つにすることを大事にする。オフラインだといろんな指標を見るけどオンラインは1つだけ。それを達成するためのオフライン指標はたくさん持つの大事。RecSysでも評価指標を目的にしてしまったらダメだって話があった。

久保さん

  • 強化学習の文脈でABテストの話聞くけど、ABテストまで行けばいい方。オフラインで足きりしたりとかはしてない。ユーザ数1%とかからテストしていく

河合さん

  • 1%とかでちょっとのユーザーで始めるの難しくない?本当は勝ってるかもしれないのに

司会

  • ビジネスKPI定量化するのって普通なの?

河合さん

  • 好きだからやってる、難しいとも思う。現場に行く、アンケートとる

久保さん

  • 好き。結局答えがないと何を目指していいかわからない。
  • チームマネジメント、評価でも使う。
  • 海外の成功してるスタートアップはビジネスKPIと機械学習のは比例している、Uberとか

オフラインで良くなったけどABテストで悪くなったとかとの場合どうなる?フィードバックとか...... 河合さん

  • エムスリーはテックブログにも書いてるし、大事にしてる 

久保さん

  • 広告だと種類によってある。オフラインのデータのバリエーションを増やしておく。オンラインだとキャンペーンとか影響があることも。評価シチュエーションを増やす。

押条さん

  • 営業ストーリードリブン。ビジネスKPIとはまあ連動してるかも

河合さん

  • 営業ストーリー難しくない?実際それユーザ嬉しいのみたいなのない?落とし所をうまくつけるのが機械学習エンジニアみたいなところある?

梅田さん

  • 最初から評価指標聞き出せないとかある。お客さんがイメージしか語ってくれない事があって大変

おわりに

今回は、自然言語処理や時系列データがどう実際のプロダクトで実装されてるかといったお話が聴けて、勉強になりましたし楽しかったです! 最近NLPしていないので、また久しぶりにちょっとNLPしたくなりました。

「真冬こそ激アツの自由研究LT大会」で登壇してきた

はじめに

2/22(金)に開催された、「真冬こそ激アツの自由研究LT大会」というイベントで登壇してきました。

engineers.connpass.com

どんなイベント?

エンジニアの登壇を応援する会が主催するイベントです。
この自由研究LT会では、技術に関係無いLTをします。登壇経験が無い人や浅い人が登壇しやすくなっています。リハーサル会と振り返り会があって、スライドの構成やデザインも見てもらえます。
私はリハ会も振り返り会も、どうしても外せない予定とかぶってしまい、残念ながら出られませんでした。

このイベントに登壇枠で参加した理由

LT登壇にまだ慣れていないので、技術関係ない話でのLT経験を積みたいと思い、申し込んで参加しました。
そもそもLTをしたいと思ったきっかけは、昨年末の「エンジニアの登壇を応援する忘年LT大会」に一般枠で参加し、いろいろな方のLTを聞いて、私もLTをしてみたいと思ったからです。これまでもLTを聞く機会は数多くありましたが、ようやく決意ができたといいますか、背中を押してもらえました。

今回は、私にとって2回目のLTでした。抽選になるほど大人気なイベントなので、抽選通って本当に良かったし嬉しかったです。
ちなみに、初めてのLTは、「もっとアウトプットしていこう!」というタイトルで、以下のイベントで行いました。
supporterzcolab.com

どんなLTをしたか

エスカレーターの話をしました。
かき氷の話と迷ったのですが、冬にかき氷の話は季節外れだと思ったのと、エスカレーターの方が他の人とかぶらなそうだと思ったからです。ちなみに冬にかき氷を食べられるお店はありますが、私はかき氷は暑い時期にだけ食べたい派です。

発表スライド


良かったこと

結構マニアックな内容だったのではないかと思うのですが、たくさん質問をいただけて、嬉しかったです!
知らなかったことも色々と教えていただきました。

おわりに

人前で話すことによって、反応をもらえたり、新たな知見を得ることができたりするのは、技術の話でもそうでなくても、一緒なのだなと感じました。
今度は技術の話でLTに挑戦したいです!

【感想】『どこでも誰とでも働ける――12の会社で学んだ“これから"の仕事と転職のルール』(尾原和啓)

はじめに

ビジネス書を読むのが好きなのですが、学びが多いと思える良書に出会えたので紹介したいと思います。

books.rakuten.co.jp

著者について

尾原和啓さんは、この本のサブタイトルもあるように、12社(マッキンゼーNTTドコモリクルートGoogle楽天など)を経験していらっしゃる方です。他の著書に、『ITビジネスの原理』、『ザ・プラットフォーム』、『モチベーション革命』などがあります。
私はこの中では『モチベーション革命』だけ読んだことがありますが、「偏愛マップを見せ合おう」、「自分のトリセツを書こう」あたりの話がためになる本でした。
books.rakuten.co.jp

私のピックアップ

これから実践できそうだなと思ったトピックのみ取り上げます。既に実践していることや、わかっていることには触れません。

第1章

自分がもつ知識はできる限りオープンにしたほうが得をする
本書を読むまでは、自分はできていると思っていました。
尾原さんの場合は、毎朝最低20人に相手に合わせた記事を一言添えて送っているそうです。

  • 常に視点を変えながら読むので、20人分の視点を自分の中に持てる
  • 仕事でも相手の視線に立って考えられるようになる
  • インプットの量を無理なく確保できる

わたしの場合は、知っていることを聞かれれば答えるし、誰かの役に立つかもしれないと思ったときには文書としてまとめて公開していますが、ここまではしていません。
実際に最低20人に送らないまでも、論文や技術系記事を読むときは、他の人の視点を意識しながら読もうと思いました。

グーグルが最高のブレスト相手になる理由

  • グーグルアラートに、出会った人のうち、これぞという人の名前を全部登録しておく

グーグルアラート、こういった使い方をしたことがなかったので目からウロコでした。
この節では他にもいろいろGoogleのサービスが紹介されていましたが、それらは私も使用しているのでここでは言及しません。

リクルートが大事にしたOBゾーン
「ここまではやるけれど、ここからはやらない」という線引を、ゴルフにたとえて「OBゾーン」とリクルートでは呼んでいるそうです。
私はゴルフを嗜まないので知らなかったのですが、ゴルフにおいて、OBはOut of Bounds(アウトオブバウンズ)の略で、 プレーが出来る区域外のことを意味するそうです。

OBゾーンには手を出さない
→美学やこだわりが生じる
→熱量が出る
→共感を呼ぶ
自分らしさが生まれて他との差別化要因ともなる

相手の期待値をコントロールする

  • エクスペクテーション・マネジメント(期待値管理)
  • 相手の期待を1%でも下回れば満足してもらえない、100%がスタートライン
  1. 期待値をある程度高めて相手の行動を引き出す
  2. それ以上は無理にあげない
  3. 本番では期待値をはるかに超えるサプライズを演出

頭ではこのようにすればいいのかとわかっても、実践までのハードルが高いです。
今まで期待値をコントロールしようと思ったことが無かったので、まずは意識するとこから始めたいと思います。

仕事ではまず、全体像と制約条件、意思決定のプロセスを押さえる
これができないと後々つらくなりますね。でも結構難しいですよね。

全体像を把握するフレームワークとして、MECE(ミーシー)というものがあるそうです。
MECEは、

  • Mutually
  • Exclusive
  • Collectively
  • Exhaustive

の頭文字を取ったもので、「相互に排他的な項目」による「完全な全体集合」です。
重複が存在する集合に対しては使えません。
MECE - Wikipedia

allabout.co.jp

また、資料づくりでは「ブランクチャート」という絵コンテを先に作るやり方があるそうです。

  1. 資料の全体のストーリーを作って各ページの役割分担を決める(課題、仮設、結論 etc.)
  2. 各ページの1行メッセージを考える
  3. 各ページの中身を吟味

この方法に「ブランクチャート」という名前があることは本書を読むまで知らなかったのですが、最近はこの方法で資料づくりを作るように意識しています。中身の吟味のほうが楽しいので先にやりたくなってしまいますが、構成は本当に大事ですね。

第2章

「始まりの場所」にいる大切さ

  • 刺激があるから成長する
  • 皆が一斉スタートである「始まりの場所」では、ベテランが多い場所と比較するとプロになれるまでの時間がそれ程かからない
  • 最初からいる人は、発展しても、どこで何が起きているか大体わかったまま成長できる

「始まりの場所」の見つけ方

  • 5年後、10年後はある程度想像できる
  • PwCKPMGNRIのメガトレンドの資料を読みつつ、世界中で観察
  • ハイプ・サイクル

www.smartinsights.com

未来予測すると良いというお話を昨年聞いたなーと思い出しましたが、まだ実行に移せていません。
未来予測の資料を読むコツは、最新版を読むときに1年前と3年前のものを同時にチェックして、何が当たったか、何が外れたかを書き出すことだそうです。これは少しずつやっていかないと、できるようになっていかなそうだと感じました。

おわりに

本書の「おわりに」の部分に、

いつものように、ぼくの本にはオリジナルなことなんて何一つありません。みなさんからいただいた言葉を自分なりに咀嚼して、言いかえていった言葉を連ねています。

とあるのですが、確かに書いてあるトピック自体は、よく耳にするものも多いのですが、とにかく尾原さんは実践力がすごいのです。私の場合ビジネス書を読むときは、最初に目次を読んで、ある程度内容を推測してから読み始めるのですが、どの章・節を読んでも、ここまで実践するのかと感銘を受けました。

Machine Learning Casual Talks #8 に参加してきました

はじめに

2019/01/28(月)に行われた、Machine Learning Casual Talks #8 に参加してきました。
mlct.connpass.com

YouTube配信されていて、以下から見ることができます!
youtu.be

当日の様子は、Twitterハッシュタグ#MLCTでもわかります。

本当に毎回人気のイベントで、今回も一般参加枠や初回参加枠は、枠に対して申込みがかなり多かったため、今回はブログ枠で申し込みました。
開催場所は、株式会社メルカリでした。
MLCTに参加したのも、株式会社メルカリのオフィスにお邪魔したのも、今回が2回目でした。
大きいスクリーンが何個かあってどの席にいても見やすいし、社員じゃなくても無料でソフドリを購入できる自販機があるし、全体的にオフィスきれいで最高です。

エムスリー株式会社の西場 正浩(@m_nishiba)さんから、ノベルティでUSB typeCオスUSB typeAメスのコネクタをいただきました!ちょうど今使っているのが壊れて買い直そうと思っていたタイミングだったのもあり、神ノベルティだと思いました。大切に使わせていただきます。

f:id:kabayan55:20190130104504j:plain:w300


冒頭

Machine Learning Casual Talks を始めた理由 Aki Ariga(@chezou) さん

『仕事ではじめる機械学習』の著者
books.rakuten.co.jp

カジュアルとは

カジュアルトークを開くと、その手の人がカジュアルに自分の好きなことばっかり話すからガチな話しかない


MLCTの狙い

  • 論文にはあまり出ない、実務で得たノウハウの共有をする
  • 機械学習の自動テスト、KPI等、わりとアルゴリズム以外の話が多い

本編

エムスリーにおける機械学習活用事例と開発の効率化 西場 正浩(@m_nishiba)さん

資料

資料の末尾に、パネルディスカッション用のsli.doの質問に対する回答も載せてくださっています。


私のメモ
各発表に対して「私のメモ」という項目で書きますが、概要ではありません。文字通りメモです。

  • ずっと使ってもらうためにはプロマネ大事、これからは機械学習×プロダクトマネジメントが大事になってくる
  • アルゴリズムOSS化すると公開できるレベルのものを作るようになる
  • 既存のサービスじゃないと、そもそもサービスに価値がないんじゃないかって話になってアルゴリズムのせいなのかどうなのかわらかない
  • 期待収益計算できると工数見積もしやすい
  • アルゴリズムで改善できることがわかっているもの
    • e.g. ニュースは地域きくって言われてる → ルールベースで出身地域のとか出して聞いたら機械学習でもいけそうだよね
  • 勤め先の昇給の仕組みや水準を理解する
  • 出世したいなら上司を出世させるのも重要
  • 技術貢献、ビジネス貢献、組織貢献

所感
少人数で回しているのが本当にすごいです!
機械学習領域でマネジメントできる人が需要あるのは本当に感じます。
キャリアの話も聞けて良かったです!
私自身は給与体系は把握はしているけれど、そこに対してきちんと戦略を立てられているとは言えない状態なので、意識していきたいと感じました。

BEDOREにおける対話エンジンの開発と運用 Nasuka Sumino(@naohachi89)さん

資料

私のメモ

  • SaaS型対話エンジン
  • 全ての企業の応答を1プロダクトで管理
  • 検索も作っている!動画解析とかも

所感

1プロダクトで管理するの、すごく大変そうだなと思いながら聞いていました。
実際大変そうで工夫をいろいろしていらっしゃるのがわかりました。
全然BtoB事情わからないのですが、クライアント側がいじるイメージがなかったので、クライアント側がダッシュボードで設定できるようにしているのが、すごいなと思いました。

LT

bfloat16について OEC (@roishi2j2) さん

資料
docs.google.com

所感
bfloat16自体が初耳でした!
会場全体でも知っていた人はほとんどいなかったようでした。
GPUが扱える、サイズが小さい、精度は十分とのことで、良い事づくしなのかなと思いました。
cloud.google.com

強化学習を可視化する chainerrl-visualizerを動かしてみた @mogamin さん

資料

私のメモ
強化学習の良いところ

  • 正答データがない問題でもできる

強化学習のつらいところ

  • 報酬設計が難しい
    • いつ報酬を与える?いつ罰を与える?
  • マルチワーカーが苦手
  • GPUをフルに使えない、CPUパワーに依存する
  • シミュレーターの開発コストが高い
    • 実際の環境、状態をもうらするシミュレータ必要
    • マルコフ決定過程をちゃんと成立させて作る
    • 状態が変わらなければ意味がない。報酬減らしたり枝刈りとか
  • 方策設計はどうあるべきか
    • いつまでも神の手を待ってると終わらない
    • アルゴリズム部、Deep Q-Network部の試行錯誤


Chainerrl-Visualizer
github.com

  • どこを見ているかが可視化できる
  • 何が取るべきactionか出している
  • 可視化ないと強化学習難しいよね
  • こういうツールいいよね

所感
LT聞いて良さそうだと思いました。そもそもChainerを普段使っていないのですが、使う機会があったら使ってみたいです。

分散深層学習のチューニングや辛い話 Shunsuke Kawai(@vaaaaanquish)さん

資料

私のメモ

  • マルチモーダルCNN
  • チャットbotも作っていた
  • * LGBMとかよりずっと良かった
  • ECの違反検知、最後は人が見てBANするけど、限界あるからそれをサポートするMLモデルは精度重要
  • 偽物の出品は少なくてImbalance data
    • ファッションは多いけど電子部品はなかったりとかそういうの
  • 「ユーザが違反 → オペレーターがBAN」の度にモデルを再学習
  • pretrain使ってるからoverfitする
    • 実際のデータでCV作ってValidationとって評価
  • 大きなデータでばらつきあるやつでやるにあたって、Chainerだと Dataset, iterators、PyTorch だとData loader, Samplerといったクラスの設計がすごく大事
  • 正例と負例を最初は5:5で実際の割合にあわせていく
  • 機械学習の観点でマッピングできるできないを考えて均等にサンプリングする
  • entity embeddings
    • embedding layerをはさむと商品の位置関係を考慮できる

arxiv.org

  • 偽物判定は数値的な大きさはあんまり関係ない
  • ヤフオク! は1円出品がある!大多数が低価格か1円
  • 内部でマイナスで表している場合もある
  • 次の画像で使うpハッシュを使う
    • 画像同士のphashを計算し同一画像をなるべく学習しないように

分散深層学習は機械学習モデリングとソフトウェアエンジニアリングの総合格闘技

chainermn.readthedocs.io

github.com

所感
ばんくしさんがヤフオク!の異常物品検知に携わっていることは知っていましたが、具体的な話を聞けて良かったです。
欲を言えば、LTじゃなくて本編の長さでききたかったです!

パネルディスカッション

パネルディスカッションは、司会の @hurutoriya さん、登壇者の @m_nishibaさんと @naohachi89 さんの3名に、sli.doでした質問に答えていただく形式でした。
app2.sli.do

聞きながら取ったメモほぼそのままなので、たぶん抜けている箇所はあるので、正確に知りたい方はYouTube配信の方をご覧になることをおすすめします。

プロジェクトの取捨選択や推進をできるレベルの人材ってどれくらいいますか?
@m_nishibaさん

  • チームに5人しかいないので今のところ自分だけ
  • サービス理解、ビジネス理解、ビジネスサイドと同じ土俵で話せる人

@naohachi89 さん


  • PMは明確なロールを持っている人がいる
  • AEからPMになった人はいまのところいないけど、わりと新しい会社なのでこれからキャリアパスが整備されるかも?

@hurutoriya さん


  • プロダクトマネージャーやエンジニア出身じゃない人がプロジェクト回せるのか?結構難しい
  • プロジェクトを回せる人材はまだまだ希少、新しいキャリアパスとしては面白いのかなー


Q. 西場さんに質問です。AIチームの目標が売上○億円にするのめっちゃ良いですが、売上の定義ってどうしてますか?レコメンドを導入したとして、そのレコメンドからのコンバージョンは100%AIチームの売上になるんでしょうか?

@m_nishibaさん

  • KPIダブルカウントでOKとしている。改善幅はレコメンドの成果

Q. マルチクラス難しそうだけどPros and consは?
@naohachi89 さん


  • 公開したくないやつはダッシュボードから設定

  • 公開非公開の設定みていろいろする

  • 1000クラスだと1000model、クライアント100だったら×100
 → その数作るよりは1 modelの方がいいかなあ


Q. 特徴量を自分で作ってロジスティック回帰を使う、NNのモデルを使う、アンサンブルをするなどで、精度と複雑さや時間とのトレードオフがあると思いますが、この辺実務ではどのように対応されていますか?

@m_nishibaさん

  • そこまでできてないが、計算時間は意識している

  • 医療画像、画像診断はスピード求められない

@naohachi89 さん

  • トレードオフは意識している
  • めちゃくちゃ精度よくても学習速度かかるとコストがかかる

  • 学習にかかる時間、推論にかかる時間、メモリ使用量


- 正解率高くてもボツにしたモデルもある
@hurutoriya さん


  • オフライン時とオンライン時のテスト基準

  • 推論時間と学習時間

  • 推論短くしたいとか運用のシンプルさとか…….

Q. サービスのインフラは何を使っていますか?(AWS, GCP, オンプレ...) ミニマムにスタートアップするとしたらどのインフラを選びますか?

@m_nishibaさん

  • AWS詳しい人が多かったからAWS使ってるけどGCPみている
  • オンプレは考えていない


@naohachi89 さん


@hurutoriya さん

  • GPU使いすぎて高いのでオンプレに移行したほうが安いんじゃね?ってなってるので、規模による
  • GCP好き

Q. 医療とITでビジネスインパクトが一番大きいのはカルテの共有と診断の(やや)自動化とのことかと思います。M3ではクラウドカルテのサービスがあるようですが、どれだけ使われていて、分析がなされているのでしょうか?

@m_nishibaさん

  • 人数少ないけど分析したい!

  • フリーテキストなのでかなりむずい、癖がある
  • 構造化すら難しい


Q. 運用の際、モデルの精度の許容範囲はどのように決めていますか?

@m_nishibaさん

  • サービスのビジネスオーナーが決める
  • ある程度悪くても受け入れてもらえるけど、ABテストやアンケートはする

@naohachi89 さん

  • モデル、どのくらい改善幅があるか?
  • 許容範囲という概念がない
  • 3ヶ月とか6ヶ月とか決めてやるのは許容範囲は大事になってくる

  • ベースラインを設定する、クライアントのビジネス要件を握ってする


@hurutoriya さん

  • どの打ち手がいいか、どのKPIがいいかみんなで考える
  • 一人で決めるのはつらい
  • プロフェッショナルからフィードバックをもらう

  • どういう問題を解くのか、大きいKPIだと難しい

  • Precision, recall

  • PoCをはやく回す


Q. 自分の会社でも利益を目標にしているのですが、機械学習ディープラーニング以外を使っていなくても自チームの調査で課題を見つけて他のソリューションで解決した場合も実績に加算していますか?
@m_nishibaさん

  • 加算していない 
  • でも楽しい、できたらめっちゃ気持ちい
  • 360度評価であの提案良かったみたいなコメントがあると考慮される

@naohachi89 さん

@hurutoriya さん

  • 機械学習じゃないものを提案することもある 
  • 評価に入ることもある


Q. 採用活動に関連して,ML関連の技術を持っている人材は不足していると言われていますが,未経験or経験が浅い人材でも採用して自社で鍛える上げることもありますか?
@m_nishibaさん

  • 入社したとき未経験だった 
  • 未経験でも取らないことはないけどポテンシャルや実績がほしい
  • 数学、コンピュータサイエンス、ちゃんと勉強はしててね

@naohachi89 さん

  • 全くの未経験はとったことないけど、学習欲あればとるかも
  • なりたい人は未経験でもkaggleとかやるよね

@hurutoriya さん

  • 自分ではじめやすい時代

Q. すべてのMLフレームワークに精通していますか?
@m_nishibaさん、@naohachi89 さん 「「していません」」


Q. エムスリーのMLチーム、MLエンジニア以外にデータエンジニアとアプリエンジニアがいるそうですが、データエンジニアとアプリエンジニアに常に仕事がある状況になっていますか?個人的にそういうチーム構成を考えているけど、MLエンジニア以外の常時的な仕事を生み出すことが難しそう。
@m_nishibaさん

  • 大丈夫、会社できて20年
  • DBぐちゃぐちゃ、そこで大活躍、基盤も作ってもらう
  • アプリケーションエンジニアは他のチームと兼任だったり

@naohachi89 さん

  • クライアント企業は大企業が多い 
  • 壁が多いからドライブしにくい?

@hurutoriya さん

  • APIあるけどクライアントエンジニアいないからリリースできないとかありそう
  • 機械学習APIできたけどクライアントエンジニアいないとかある
  • 小規模チームだとアイドルタイム多そう
  • 多いとスピード上がりそう

Q. MLは大きいところを狙いたいので老舗大企業と組みたい vs 老舗大企業は組織間の壁が厚く辛い のジレンマに陥ることってありますか(私は陥っています)
@m_nishiba さん

  • 感じない 
  • LINEヘルスケアとやってるが、いいとこ取りができている
  • グループ会社は若いとこある、組んでる
  • 学生が作ったベンチャーに仕事依頼したりもあった

@naohachi89 さん

  • 企業による
  • プロジェクトによる
  • 受注という文脈?


Q. ばんくしさんへ、スマホ機械学習の状態を監視や操作をするために使った技術を知りたいです!
@vaaaaanquish さん

  • ヤフーだと社内システムが整っている
  • 社内の自製チャットツールのAPIたたき放題でそこに全てのログを流す

@hurutoriyaさん 

  • 体制ないと真似できないですねー

本イベントの、他の参加者のブログ記事

upura.hatenablog.com
watarumon.hatenablog.com

Women in Machine Learning @Google Japan に参加してきた

はじめに

本日2019年1月26日(土)に開催された、Women in Machine Learningというイベントに参加しました。
www.meetup.com

本イベントの主催は Machine Learning Tokyo というよく機械学習関連のイベントを行なっている団体と、Google Japanです。私自身はMLTのイベントは初参加でした。

machinelearningtokyo.com
www.meetup.com

全てのトークは英語だったので、英語で感想を書こうかなと思ったのですが、一旦日本語で書きます。
余裕があったら英語版も書きます。

資料は現時点ではどなたも公開していらっしゃらなかったようでしたので、載せていません。

感想

1. "Handling Gender in Google Translate", Anja Austermann, Software Engineer, Google Japan (Google Translate)

以下のブログを始めとした、いくつかの記事でこの話を以前に読んだので、ちょうど気になっていました。
www.blog.google
翻訳において、性別の部分の対処は一筋縄でいかないことも多くて大変だということがわかりました。
性別が決まっている単語(e.g. wife)もあれば、無い単語(doctor, manager, nurse etc.)もあります。
また、言語によって、男性か女性かで違う単語を使っていたり、男性でも女性でも一つの単語で表現できる場合もあります。
気にしすぎると性別関係ない部分にも性別の表現が出てきてしまったりするみたいです。

2. "Machine Learning in Space", Danielle DeLatte, PhD in Aerospace Engineering at the University of Tokyo

クレーターの検出をアンサンブル学習でして、可視化もしたというお話をうかがいました。
航空宇宙でどうMachine Learningするかといったお話を聞く機会は今まで全然なかったので、すごく新鮮で、面白かったし自分自身も分析してみたいという気持ちになりました。
分野が違えど、すること自体は一緒なんだなーと思ったり。
航空宇宙に関するデータ分析をしたい人は、以下のデータセットが使えるようです。
archive.stsci.edu
pds.nasa.gov
www.kaggle.com

"End-to-end Pre-modern Japanese Character (Kuzushiji) Recognition with Deep Learning", Tarin Clanuwat, Researcher at the Center for Open Data in the Humanities, National Institute of Informatics

Kuzushiji は、「くずし字」です。古文書で使われているくずした形で書かれている文字です。
今くずし字を読める人は、日文と歴史の研究者、書道を習ってる人くらいみたいです。
私は読めません。
アノテーション大変だという話を聞きましたが、確かにそもそも読める人が少ないのに行ったり頼んだりするのは大変ですよね。
くずし字のことはよく知らず、初めて聞く話だったので、とても新鮮でした!
ひらがなも漢字も、元々一つの字に対して書き方がたくさんあったというのが衝撃でした。
現代に生まれて良かったです。笑
絵の書いたものに文字が書かれていたり、全て縦書きで読んでいけばいいという訳でもなく、ブロック(段落?)がダイナミックにオシャレな感じに配置されていたり......。
ひらがなの「く」と「くの字点」がとても似ているのですが、私には見て違いがさっぱりわかりませんでした。


Data Setがあって、Kuzishiji-MNIST、Kuzishiji-49、Kuzishiji-Kanjiというのがあるそうです。
www.lyrn.ai
www.kaggle.com

"How to become a data scientist", Etsuko Tane, Market Researcher, BrainPad Inc.

データサイエンティストの女性は、O'Reillyの調査によると世界で20%、データサイエンティスト協会の調査によると日本だと12%だそうです。もっと増えるといいなと思います。

データサイエンティストになるメリットとして以下の3点を挙げていらっしゃいました。

  1. バックグラウンドはCSや統計でなくても良い
  2. 世界のどこでも仕事を探せる、働ける
  3. 年収高い

実際に仕事では、私自身も、いろいろな分野の出身の人たち、様々な国籍の人たちと現在仕事をしてます。
これは1. や 2. の恩恵だと思います。

データサイエンティストのスキルセットは大きく3つにわけて、「ビジネス力」「データサイエンス力」「データエンジニアリング力」です。全て完璧に身につけるのは難しいと思われるとのことでした。同感です。
よく見る図のやつですね。
prtimes.jp

おわりに

パネルディスカッションの時間があったのですが、質疑応答が活発で20以上質問が出ていました。
Machine Learningに携わる活躍する女性の方々のお話を聞けて、大変刺激を受けました!
参加者同士でも交流することができ、有意義な時間を過ごすことができました。