かばやん's だいありー

かばやん's だいありー

学んだことをゆるゆるアウトプットしていきたいです。

【Merpay x M3 x PFN 共催】Machine Learning Night に参加してきました

はじめに

本日2019/12/10(火)に行われた、【Merpay x M3 x PFN 共催】 Machine Learning Night に参加してきました。本勉強会は、Machine Learning Production Pitch*1 番外編です。

machine-learning-pitch.connpass.com

当日の様子は、Twitterハッシュタグ#mlppでもわかります。

LT

田中 龍亮さん (エムスリー株式会社)

資料

私のメモ
各発表に対して「私のメモ」という項目で書きますが、概要ではありません。文字通りメモです。

  • embeddingで情報を密にしてあげてる
  • 希少疾患・希少薬剤とかにグラフラプラシアン効く
  • タグ付の方と、両方が相互で良くなっていく

大垣 慶介さん (エムスリー株式会社)

資料

私のメモ

  • 10月入社で1つ目のプロダクト
  • アンケート分析して終わりじゃもったいない!!!
  • レコメンドとかパーソナライズに使いたい

  • 性格の計画が分かるタイプのアンケート

  • 予測できるというか傾向がつかめる、ログを使ってアンケート結果の予測ができる

www.m3tech.blog

所感
アンケートってみんなが答えてくれるわけではないし、アンケートのデータ取れるユーザだけ使うと「アンケートに答えるようなユーザ」のバイアスがかかってしまうので、確かに予測するのは良さそうだなと思いました!

本編

MerpayにおけるML活用のポイント 竹原 一彰さん @_zak3 (株式会社メルペイ)

資料
12/11時点では公開を確認できていません。

私のメモ

  • MLチーム 、8人
  • 課題発見からモデリング、マイクロサービスの提供まで
  • pjo*2-tl*3-em*4体制
  • Go言語
  • GCP縛り

メルペイ
今3年目、2019年2月にローンチ

  • メルカリスマート払い*5の与信枠は機械学習で決めている
  • AML (Anti-Money Laundering) マネーロンダリング対策
  • 疑わしい取引を検知して人がチェック

  • チームの3年ロードマップ

  • A4 2枚程度でミッション、取り組むべき重要案件

  • ソフトウェアエンジニアとして課題を解く

  • 精度の良いモデルだけでは不十分

  • Data Validation

  • 各マイクロサービスがアグレッシブに変えてしまう。モデル動かせなくて検知

  • 8人しかいないので解くべき課題にフォーカス

  • 相談された時に安易に受けない

  • 1-3ヶ月で1st version

  • 問題に適した技術

  • いきなりディープラーニングとかしない

  • レビュープロセス等いろいろ改善、ルールの追加だけでなくて廃止も

所感
解くべき課題にフォーカスすることを徹底されているのが特に素晴らしいと感じました!

Preferred Networksの顧客向けプロダクト開発 谷脇 大輔さん (株式会社Preferred Networks)

資料

私のメモ

  • 国内最大級のGPU!!

  • 今年からプロダクト開発チームができた!

  • 優れた研究成果を世に広めるために将来のスケーラビリティを考慮したアプリケーション開発を高品質かつ高速に行う

  • 顧客ごとにプロジェクトがある

  • インフラは本番環境は顧客ごと、devは共通だがアプリは分ける
  • プライバシー

  • アプリ、micro service

  • ドメインが同じ場合は、共通ロジックを再利用できる。マイクロサービスはいい
  • 研究者のjupyterのやつを上げるためにpythonの推論サーバ(言語依存内容に

  • 今までは研究で注目されてきたけど、それをどうやって活かしていくかというところを最近頑張っている、アプリケーションエンジニア採用中

preferred.jp

所感
元々研究でかなり成果を出していらっしゃるPFNさんが、研究を実際に活かしていくことにも最近は注力しているとのことなので、今後どんどんビジネスに活かしていかれるかと思うと楽しみです!

sansan紹介(Sansan株式会社 執行役員/CTO)

今月テック系のTwitterをはじめたみたいです! twitter.com

パネルディスカッション

モデレータ:藤倉成太さん(Sansan株式会社 執行役員/CTO) パネラー:谷脇 大輔さん(株式会社Preferred Networks), 西場 正浩さん(エムスリー株式会社) , 竹原 一彰さん(株式会社メルペイ)

Q 事業を形にできている成功している企業だと思うが、どう事業化に結びつけてきたのか?
PFN

  • 研究で成果ができたらどう活かしていこうか?ってなって企業とやる
  • 予算、費用を担保
  • 開発を続ける

メルペイ

  • データプラットフォームは初期初からあった
  • ビジネスのコアを見極めて提案するのはmLエンジニアから
  • お問い合わせは断りつつ、MLエンジニアから提案を徹底

M3

  • そもそもプロダクトからチームスタート
  • 2年半か3年前から。機械学習素人でルールベースとかから頑張った
  • ルールベースで他のとこがやってるのを横展開にするとすんなりいく

メルペイ

  • MLエンジニアは新しい物好きなのでほっとくとR&D的になってるから縛りは強くしている
  • 解釈性

Q PFNさんは事業化の道が見つからないことはあるのか?
PFN

  • ないわけじゃない
  • 共同研究先が大企業だから、大企業のやりたいことを研究するから闇雲にやってるわけではない

Q PFNさんに クライアントさんが先に問題設定してるってことはある?
PFN

  • 結構ある
  • プロダクト開発チームが早い段階で入って、もった方がいい観点をサポート

Q M3は?
M3

  • 今は目の前のできることを一個一個やる

Q どこまでカバーしますか?
M3

  • 障害起きたらMLエンジニアもいく 
  • サクッと作って出してるのでAPI落ちてカバーできなかった時は、何かしらフロントが表示してくれている
  • 晦日に出勤したこともある

メルペイ

  • フロントはしないが、バッチシステム
  • SLO*6を高くしすぎない
  • 夜間バッチをなくす、週次バッチ、など工夫

PFN

  • プロダクト開発チームが発足して早いので、24時間365日対応のプロダクトは今はない
  • AWS上でCICD、アプリ監視も自分たち
  • 運用はミッションではない、研究を世のニーズにマッチしていることを示す

Q コード書くとこまでやりたがるのか?採用とかの時にそこまでやりたくないって人もいるのか?
PFN

  • 研究系は本当に研究でアプリは一切やらないけど一点突破って感じの強い人、
  • プロダクト開発チームは機械学習に強い人はそこまでいない
  • キャッチアップは重要

メルペイ

  • 運の良いことに、モデルだけやりたいみたいな人はいない
  • 得手不得手はあるが、チームのアサインで工夫

  • モデルだけだと厳しい時がある、仕事がなくなってしまう

  • 採用時にマッチングを意識的にやっている
  • 会社ではビジネスコミットしてプライベートでは大学院とか

M3

  • 採用時にプロダクションコードまでやるって言ってて、チャレンジしたいならOK
  • docker作ってインフラにはdockerで渡す

Q ML系の周辺のサービスやツールは助けになってる?
メルペイ

  • 昔ほどネットワーク設定やサーバ構築からしなくていい
  • 専門性は必要だし難しいので補いながら

M3

PFN

  • モデルはリアルタイムに更新するのは今ない
  • AWS SageMaker*8とかは使ってない
  • モデルはS3にアップロードしてロードして使ってる

Q 課題
PFN

  • 解決しつつある課題
  • 推論サーバをどう作るか
  • 研究者がjupyterで描いたやつをプロダクションで使えるように

メルペイ

  • 与信枠、完全MLではない、ビジネスロジックでフィルター
  • うまい融合は難しい
  • 自動化の範囲を広げればいい?

M3

  • 解決すべき課題は正しいのか?

Q これからのチャレンジは?
M3

  • 新しいプロダクトの発見をグローバルにしたい
  • 医療に貢献したい、40兆円くらいを10兆円くらい減らしたい
  • ミッション高く仲間が欲しいかつ腕に自信がある人腕を磨いていきたい人と働きたい

メルペイ

  • 与信続ける
  • お金の流動性が上げていきたい
  • お金を滑らかにしている
  • 欲求を満たすような推薦、検索
  • MLは手段の一つでミッションを実現する人と働きたい

PFN

  • 新しい事業を作っていくフェーズ
  • 周りと協力しながら働く人
  • 専門分野以外のキャッチアップに会社が協力的
  • 特許・論文の勉強会も社内にある

sansan

  • まだ人力も結構ある
  • クラウドワーカーさん数十万人!!!

  • 100%ソフトウェアに可能なら変えたい、まだまだチャレンジの領域はある

  • 機械学習は、今までできなかったことをできるようにする領域

PFN

  • 研究で終わらず事業化していくか考えるのはチャレンジ

おわりに

各社のチームのこと、課題、どういった感じで仕事しているかを知ることができて良かったです。 懇親会も盛り上がって楽しかったです!ありがとうございました。

本イベントの、他の参加者の記事

tenajima.hatenablog.com

yhiss.hatenablog.com

過去に私が参加したMLPPの記事

kabayan55.hatenablog.com

私がエンジニアにオススメする英語ツールまとめ

はじめに

2019年12月6日(金)に、サポーターズCoLab女子会*1にて、今年の推しツールについてLTをしました。 せっかくの機会なので、このLTで紹介したツールと、普段使ってる英語ツールについてこの記事で紹介したいと思います。「エンジニアに」とタイトルに入れましたが、エンジニア以外の方にもオススメなツールも多いと思います。

発表資料

Read Aloud

Read Aloudは、Text-to-Speech(テキストの読み上げ機能)のChrome Extensionです。 同様の機能を持つChrome Extentionはいくつかありますが、いくつか試して一番使いやすかったのでRead Aloudがお気に入りです。 Voice, Speed, Pitch, Volume, Text Highlightingの機能があります。 声が200以上はあるので苦手な声でイライラすることもないですし、スピード調節は重宝しますし、テキストハイライトはどこの部分を読んでいるかがすぐにわかるので便利です。私自身は英語しか使っていませんが、40ヶ国語以上サポートされているようです。

chrome.google.com

Read Aloudを使う場面

長文を読むとき
私の場合、英語の長文を読む時は、普通に上から読んで、わからない単語を調べつつ読むというスタイルです。 読んだ内容を日本語で説明する必要がある場合は、全文翻訳で概要を掴んでから読み始めることもありますが、読んだ内容を英語でシェアする機会の方が多いので、基本的にはそのまま英語で読み始めます。 ただ、日本語の文を読んでいる時と比べて、私の場合は集中力が切れてしまうことが多いので、このツールをたまに使います。 どうしても集中力が続かないときや他の考え事をしてしまう時に、目と耳から同じ情報を入れることによって、意識を文を読むことに集中させています。私としては、目と耳からインプットをした方が、理解が早まるように思います。

語学学習
中学・高校の英語の授業で使用していたテキストは、教科書とCDがセットになったものが多かったように思います。 大学受験の際は、ニュース記事とそれに対応したCDの教材を買って学習していました。似たような教材で語学を勉強した、あるいはしている方も多いのではないかと思います。 このツールがあれば、ネット上の記事全てが語学学習教材に様変わりです! もしツールで間違った発音があって間違えたまま覚えてしまうと問題かとは思うのですが、かなり音声生成技術は高いと思うので、そんなに気にならないかと思います。 また、英語だけでもUS English, British English, Australian Englishがあるので、聞き比べをすることができます!

余談:わたしと音声コンテンツ

読み上げ機能のツールを紹介しているので音声好きなのかなと思われそうだと思ったのですが、音声のみのコンテンツは苦手です。動画は好きです。

どのくらい苦手かというと、2019年に最初から最後まで聞いたPodCastは現時点で以下の3本しかありません。 しがないラジオ*2白金鉱業.FM*3も "Show notes" があって、音声だけのコンテンツが苦手な私のような人にもとっつきやすくなっています。本当にありがたい......!! 白金鉱業.FMの方は、"Episode WordCloud" もあります。

私は利用したことないんですが、Voicy*4 はラジオやPodCastと比べて1つ1つが短いものが多いみたいなので、ちょっと聞いてみたいなーなんて思っています。

Grammarly

Grammarlyはスペルチェックをしてくれるツールです。 私はChrome Extension版を使っています。

chrome.google.com

↑ スペル間違っていますが笑

英語で

  • メールを書くとき
  • ドキュメントを書くとき
  • JIRAチケットを書くとき
  • pull-request にコメントを書くとき

本当に毎日お世話になっています。

どこでも翻訳 Translate Anywhere

こちらもChrome Extensionです。

f:id:kabayan55:20191229223611p:plain:w300

Google翻訳を用いたページダイレクト翻訳もできますし、自分の書いた文を翻訳することもできます。 コピペで一部翻訳もどんとこいです。

codic

codicは、プログラマーのためのネーミング辞書です。変数名や関数名を考えるとき、英語でどの単語を使うべきかを考える必要が出てくると思うのですが、そういった時に便利です。ただ、codicに与える日本語がよくないと良いネーミングはできません。

codic.jp

lyricstraining

lyricstraining.com

これはおまけです。仕事で使うツールではありません。 流行の洋楽の知識を入れて、コミュニケーションを円滑にするのに最適です。 単純に楽しいので、一時期かなり夢中でやっていました。

Mouse Dictionary

qiita.com

KaggleでもMouse Dictionaryを使えるようにする - Qiita

英語辞書ツールのChrome Extensionです。Firefox版もあります。つい最近入れて、まだそんなに使っておらずあまりわからないのですが、評判はかなり良さそうです。 複数単語から成る熟語やイディオムの意味も自動的に表示してくれるところと、camelCaseとかsnake_caseみたいな表現も単語にバラして個々の意味を表示ところが特に良さそうです。

まとめ

私が使っている英語ツールの紹介をしました!どのツールもいろいろと使ってみた上で選んでいるので、ぜひ参考にしてみてください。

「自然言語処理の勉強をしたい人」を対象に登壇した話

はじめに

この記事は、自然言語処理 Advent Calendar 2019 - Qiita の3日目の記事 兼 サポーターズCoLab Advent Calendar 2019 - Adventar 3日目の記事です。

qiita.com

自然言語処理 Advent Calendarは、自然言語処理に関するテーマであれば何でもOKとあったので、このタイトルで記事を書くことにしたのですが、クオリティの高い技術系の記事ばかり出て来そうな雰囲気を感じているので、ちょっとドキドキしながら書きました。

本記事では、自然言語処理を勉強したい人向けに、サポーターズCoLabで講師をした際に得た気づきを共有したいと思います。

アドベントカレンダー2つ兼用と欲張りな感じにしてしまいましたが(実は会社の同期アドベントカレンダーとも兼用)、以下のように考えています。

  • サポーターズCoLab講師の方やサポーターズ講師をしてみたいと考えている方、自然言語処理を勉強する人に対してアドバイスをすることに関心ののある方には、知見をお伝えしたい!
  • 自然言語処理界隈のプロの皆様にはオススメの勉強法があれば教えて欲しい!
  • 自然言語処理を勉強したいと考えている方には、発表資料+私のオススメする理由を読んで欲しい!

軽く自己紹介

サポーターズCoLabとは

supporterzcolab.com

supporterz-seminar.connpass.com

ざっくり一言でいうと、株式会社サポーターズが若手エンジニア向けに勉強会やミートアップを開催しているコミュニティです。

追記(2020/04/07):
サポーターズCoLabは2020/04/16にてサービス終了です。

私が講師をした勉強会

supporterzcolab.com

「はじめてみよう!自然言語処理」という名前の勉強会で、自然言語処理の概要と勉強方法についてお話しいたしました。 講師と書かれていますが、形式としては登壇の方が近いと感じました。

発表資料

発表当時はうさぎのアイコンを使っていました。デフォルメ似顔絵アイコンに変えたのは最近です。

講師をすることになった背景

  • サポーターズCoLabの方に、「講師やってみない?」と聞かれ、特に話したい内容は決めていなかったが「やってみたいです!」と即答した結果、決まった
  • サポーターズCoLabの方に、「機械学習自然言語処理あたりで何か話せればと考えています〜」と話した結果、「自然言語処理の勉強法とか需要ありそう」とアドバイスをいただいたので、そのままその案を採用

初心者向け勉強会は、機械学習やデータ分析がテーマのものは見聞きしますが、自然言語処理のものはあまり見聞きしない上に単発のものが多い印象です。私が知らないだけである可能性は大いにあるので、ご存じの方はぜひ教えて下さい!

こういった勉強会の需要はあるのか

講師をする前
私「正直な話、自然言語処理の勉強法は、小町先生のページに全てまとまっているし、私に話せることなんて存在するのか?」

cl.sd.tmu.ac.jp

cl.sd.tmu.ac.jp

自然言語処理を勉強した方々、あるいはこれからしようと考えている方々はおそらく一度とは言わず何度も見たことのあるページかと思います。 学び方が多くあって人それぞれである分野は多いと思うのですが、自然言語処理においてはそんなに人によって勉強法に差が無いのかなと感じました。

講師をした後

  • 「検索すれば出てくるような内容しか無かった」という意見と「検索しただけではよくわからなかったので参考になった」という意見があった
  • そもそもこの勉強会の対象者は「検索したけどよくわからない」という人向けのつもりだった
  • 各勉強教材の感想を生で聞きたいという需要はありそうだったので、こういった勉強会の需要はあると感じた

どんな人が勉強会に参加していたか

非エンジニアから自然言語処理エンジニアに、といった方には私の記憶が正しければお会いしませんでした。

本当にこの勉強法が初学者にとっていいのか?

基本的には、私が実際に勉強する際に使用していた教材を紹介しています。登壇の直前に読んで良いと思って紹介したものもあります。自分が使用していないものは紹介することができないので、それは当然かもしれません。「この書籍良いらしいよ」と語っても、自分の言葉では無いので刺さりません。

私自身のスライドではDeep Learningの話はしていないのですが、『ゼロから作るDeep Learning ❷ ―自然言語処理編』をオススメしている方もお見かけしたことがあります。『ゼロから作るDeep Learning ❷ ―自然言語処理編』は、『ゼロから作るDeep Learning ―Pythonで学ぶディープラーニングの理論と実装』を読んだ上で読んだ方がいいと思うので、初学者にオススメして自然言語処理編までたどり着かない場合もありそうだなと思い、スライドでは取り上げませんでした。 取り上げなかった一番の理由は、私自身が読み込めていないからです。

私のスライドは、勉強例のうちの1つくらいに思っていただければと思います。新しい書籍もどんどん出ていますし、私がまだ読めていない書籍もたくさんありますので、正直紹介できてないものも多いです。

オススメした教材と、紹介した背景

言語処理100本ノック

www.cl.ecei.tohoku.ac.jp

学生時代にPython 2.7でやったので、Python 3でコードも綺麗に書くようにしてやり直したいとずっと思いつつ、まだできていません。 自然言語処理に関する基本的な実装がカバーされていて無駄がないこと、他の人のコードと比較できること、取り掛かりやすいこと、がオススメ理由です。

追記(2020/04/07):
言語処理100本ノック 2020が最新です。 nlp100.github.io

NLP プログラミングチュートリアル

www.phontron.com 3周しました。 研究室のゼミで教わる側として1回、教える側として1回行いました。 社会人になってから、会社の同期勉強会で自然言語処理を勉強したいとの声があったので、本教材を選んで輪講を行いました。 参加者は、エンジニアあるいはCS専攻出身のPDMだったので、擬似コードがあったり演習が付いていたりする本教材は良かったように思います。 プログラミングから理解するタイプの人にはオススメですが、数式から理解する方が好きな人には他の教材の方が良かったかもとは思いました。

長岡技術科学大学 自然言語処理研究室

www.youtube.com

あまりこのチャンネルの話を他の人としたことがないのですが、チャンネル登録者数が1,000人以上いるので、結構人気のあるチャンネルだと感じています。初学者はなかなかこのチャンネルにたどり着けそうだなと思って紹介しました。文献紹介の動画がたくさん上がっていて、素晴らしいチャンネルだと思っています。初学者向きなのは「3年勉強会」だと思ってスライドにはそう書いています。

追記(2020/04/07):
2020年3月に研究室閉鎖とのことなので、おそらく今後の更新はないと思われます。チャンネル自体は残っており、動画の閲覧は可能です。

『言語処理のための機械学習入門』

books.rakuten.co.jp

口頭で紹介しました。研究室ゼミで3周しました。勉強しやすい良書ですが、数式に苦手意識があるとキツいかもと判断した上でスライドには載せていませんでした。

Kaggle

www.kaggle.com

Kaggle は、機械学習コンペティションのプラットフォームです。 Kaggleについては、以下のスライド資料の説明がわかりやすいと思います。

Kaggleは教材としてオススメしたというよりは、勉強を始めてどんどん実装して見たいとなった時に、挑戦する場としては良いと思うという話をしました。ほぼ口頭で話してしまったので、もう少しKaggle自体の説明やどうやって取り組めば良さそうかといったこともスライドに含めた方が良かったかもしれません。私はテーブルコンペにしかsubmitしたことがないNovice*1なので、これは私の経験に基づく提案ではありません。
発表数日前にちょうど目にした以下の転職エントリに感動して、どうしてもKaggleの話を入れたくなって入れました。

kaeru-nantoka.hatenablog.com

今の私から当時の私へ一言「この転職エントリ記事自体を紹介すべきだったと思う」

機械学習エンジニアになりたい人のための本』

books.rakuten.co.jp

実はこの登壇の前に読んだ本です。勉強教材ではなくて、タイトル通りどうやったら機械学習エンジニアになれるかという内容です。

おわりに

登壇した上で一番実感したことは、体験をともなわないアドバイスはできないということです。 また、勉強法はベースは変わらないにしろ、新しい本が出るのでどんどん読んでいかないと、比較した上でアドバイスをするのは難しいと感じました。 登壇駆動で何冊か新たに本を読んだので、良い機会になったと思います。 個人的には、今度はハンズオンをしてみたいなと思っています。まずはネタを考えるところからですけどね!

*1:Kaggleにはランクが5つあり、上からGrand Master, Master, Expert, Contributor, Noviceです。Competitions, Datasets, Kernels, Discussionそれぞれにおいてランクがつきます。

推し本『現場の「ズレ」を解消するコミュニケーションメソッド』と出会ってからの私

はじめに

この記事は「【推し祭り】技術書典で出会った良書 Advent Calendar 2019 」 の2日目の記事です。 タイトルの通り、『現場の「ズレ」を解消するコミュニケーションメソッド』について書きます。

adventar.org

今年購入した技術同人誌

技術書典は6と7、両方行きました!
以下に今年購入した技術同人誌全てを載せます。 買った技術書は全て読んだので、積ん読無しです!!
推しの1冊を選ぶのは結構迷いました。読みなおした回数の多さで決めました。

技術書典6

技術書典7

BOOTHで購入した技術同人誌

『現場の「ズレ」を解消するコミュニケーションメソッド』はどういう本?

この本は、マネージャー(部長など)とメンバーとの現場に焦点をあて、メンバー側とどういった「ズレ」が発生しているかの原因と、「どういったアプローチがあるか」を書いた本となります。
(『現場の「ズレ」を解消するコミュニケーションメソッド』はじめに より引用)

構成は、現場あるある(困りごと)、原因観点リスト(どう解決するか)、メンバーへのチェックリスト、原因観点リスト説明、失敗しがちな判断、コラム、もっと深めたい方への紹介、となっています。

BOOTHで買うことができます。

Twitterハッシュタグ#ズレコミュ で他の人の感想も見れます。

本書との出会い

技術書典6で見かけて購入しました。この日は、元々は業務(機械学習)に関係ある本のみ買う予定だったのですが、タイトルを見て、当時の自分にとって必要だと感じたので購入しました。ちょうどプロジェクトもチームも新しくなり、良いチームにしていきたいという意思を強く持っていた時期でした。 即買いしたかというとそうでもなくて、表紙に「マネージャーのための」とあったので、私マネージャーじゃないしな......と少し迷いました。見本誌を手にとって、対象読者の項目に、「マネージャー、部長のみなさんをメインターゲットとしていますが、メンバー側からなぜすれ違うのかを見ていただく上でも参考になるのではないかと考えます。」とあったので、購入を決意しました。実際、メンバー側から見ても役立つ本だと今思っているので、購入を決めた当時の私に拍手を送りたいです。

本書を1回目に読んだ時の感想

実際に本書を読んで、仕事にどう活かせたか

1回目に読んだ時期の私自身の状況

  • 私はマネジメントをする側ではない
  • 新しいプロジェクト、新しいチーム、新しいチームのリーダーと 1 on 1 ミーティング開始
  • 1 on 1 ミーティング の議題を出すのは基本的にメンバー側だと思うが、何の話をしていいのか悩む
  • 自分のスキルアップのために 1 on 1 ミーティング を有効活用したいという意思はある
  • チーム内に「ズレ」があることは認識しているが、何をどう改善していくべきかはわからない状況
  • 報連相は完璧にこなしていると思っていたが、実はできていないかもと気づき始めた時期

メンバーとしての本書の使い方(私の場合)

  1. 自分が置かれている状況に近い「現場あるある」を探す
  2. 「原因観点リスト」を確認
  3. 「メンバーへのチェックポイント」にある質問に自分で答えてみる
  4. 必要であれば、回答にあたる部分をマネージャーに伝える

1 on 1 ミーティングでやったこと

1 on 1 ミーティングは自分自身のスキルアップの機会にしたいと考えて様々なトピックの話をしますが、本書に関係する部分はチームワークのスキルだと思っています。 「ズレ」を解消するために、自分の現状を伝えた上でフィードバックをもらい、不定期に 1 on 1 ミーティング中に同じ話題を出して改善しているかをトラッキングしてもらいました。

例)

  • 初回の1 on 1 ミーティングで、自分が相談と質問が苦手かもしれないと伝えた
  • 「相談フォーマット」にそってやってみようと考えているという話をした
  • 相談/質問すべき時にできていなかったり、相談/質問の仕方が下手だったりする場合には、率直なフィードバックをしてほしいとお願いした

日々心がけたこと

  • 本書p.17にある相談フォーマットを仕事用ノートの1ページ目に書いて、それに沿って説明できるようにしてから相談するようになった
  • 相談や質問の回数を増やすように心がけた

約半年でどうなったか

  • タスクの手戻りが以前より減った

おわりに

私自身は、良いチームを作るのは、マネージャーの努力ももちろんあるとは思うのですが、チームメンバー全員の気持ちも大切だと思っています。本書の「メンバーへのチェックポイント」がたくさんあるのを見て、マネージャーに逐一質問させるのではなく、聞かれる前にメンバー側から伝えることで、マネージャーの負担を減らせるのではないかと考えて、この半年行動してきました。マネージャーかメンバーか関係なく、良いチームを作りたいと考える人たちが、一人でも多く『現場の「ズレ」を解消するコミュニケーションメソッド』を手にとって良いチームが増えたら良いなと思って本書を推させていただきました。ぜひ読んでください!

「落合陽一が今、20代エンジニアに伝えたいこと」に参加してきました

はじめに

本日2019/10/30(水)に行われた、「落合陽一が今、20代エンジニアに伝えたいこと 〜エンジニアは、テクノロジーとどう向き合っていくべきか?〜」というイベントに参加してきました。

supporterzcolab.com

当日の様子は、Twitterハッシュタグ#sptzcolabでもわかります。

Q&A 前半

・飲み会誘われたときどう断っているか?
飲み会誘われてもそもそもカレンダー埋まっている、23時からとかなら参加できる

・睡眠時間は?
4時間くらい

・エンジニアとして掛け算しておもしろいことは?

https://cdn-blog.adafruit.com/uploads/2016/03/neri-oxman-cycle.jpg

www.keidanrensdgs.com

諸外国の諸問題とか? どの問題を誰が解決するか、ケーススタディの方が興味ある

シリコンバレー
創業した会社はアメリカだけど、基本日本 ラボは国際会議しか出さない

・結婚の決め手は?
考え方が違うところ

自己紹介

研究室 digitalnature.slis.tsukuba.ac.jp

アートティストとしては、今年は日本で個展を3回

書籍で一番のオススメは『魔法の世紀』。 books.rakuten.co.jp

Note note.mu

サロン lounge.dmm.com

公式YouTubeチャンネルはあるが動画はない t.co

Q&A 後半

・デスクトップの背景気にになる キルラキルの元になったフォント(ラグランパンチ)
fontworks.co.jp

・エンジニアの向き不向きはありますか?修行ですか?
視点をどこにおくかは重要

・自分が本当に好きなものを突き詰める前に、将来が不安だからと、エンジニアになるための技術的な部分をまず詰め込んで置こうとすることは危険ですか?
どの領域に興味があるかを手を動かしたほうがいいかも

・今22才だったら何をしますか?
国外の大学で博士を取る エンジニアとして生きていくのに専門性があるやつ Deeplearningとか流行りのものではないもの

・英語を話せないエンジニアの仕事はなくなると思いますか?
結構なくなると思うけど、流暢でなくても大丈夫だと思う コミュニケーションはできた方がいいと思う 逆はある、海外の人が全て日本語を翻訳している人もいる

・20代に戻ったら何に注力するか?
漁業 イルカと対話したい、海の上で過ごしたい

・落合さんの夢は?
ロードマップははっきりしている 研究だと何年に何をするか決めてる

どうやって人間自身がエンジニアリングを使えるようになるか?

・日常的に見るネットメディアは?
BBCとCNNのTwitter

スマホの次はARグラス?
スマホで解決できる課題がたくさんあるからまだスマホ

・月の読書量はどのくらいですか?
1日1冊、月30冊

・大学院にいくメリットは?
全員行って欲しい、博士までとって欲しい 専門性に軸足がないエンジニアは簡単にリプレイスされるから

・とてもお忙しいと思うのですが、普段どうやって知識を増やしたりスキルを上げたりなさっていますか?
なるべく人にあった時に聞く サーベイや査読 arXivdeep learningの論文は最近は話題になったものしか読んでいない

・好きなフロントエンドの言語は?
JS Python, Go

・今学んだ方がいいこと
習慣が重要。 研究の定例ミーティングを入れることから始めた

コンピュータサイエンス学んだ方がいいのか?
潰しが効くとは採用の人には思われるけど、スーパーエンジニアとしてどうかというと......

・時間を無駄にせず、効率よく動くために工夫してることはありますか?
タクシーで移動

・最先端の技術はどうやって学んでいますか?
研究論文

・なぜ研究者と起業家を双方志して、どういうことをされてきたのでしょうか。比較的近い年代でかつ同業界に今いますが、大きいプロジェクトを少人数で3つ回すと気がつけば時間が溶けていきます。何を心がけ普段行動されてるでしょうか
予定に隙を作らないこと

・20代のエンジニアに期待することはなんですか?
すぐ作る、言われる前に作るくらいでいい

・ビジネスとテクノロジー、どちらのほうが好きですか?あるいは、どちらのほうが向いていると思いますか?
どっちも好き

・エンジニアにポートフォリオは必要?
必要

・遅寝早起きのコツは?
45分起きに3台でアラーム

・20代エンジニアに伝えたいこと
20代のはじめから、具体的に何をしていかロードマップ作れるといいと思う 数値目標、何やるか 14歳の頃から予定表をかなり細かく作っていた

所感

ほぼQ&Aで、Slidoの質問に答えていただく形式でした。 かなりのスピード感で、検索や過去資料を用いながらたくさんの質問に答えていただきました。この記事に書いてあるのは一部で、お忙しい中予定より30分も長く講演してくださいました。 落合陽一氏の書籍は何冊か読んできましたが、講演を聴くのは初めてだったので大変良い機会でした!

本イベントの、他の参加者の記事・まとめ

lemonpasta.hatenadiary.com gunchari.hatenablog.com twitdoc.com note.mu

Machine Learning Production Pitch #4 x ML@Loft #6 に参加してきました

はじめに

2019/9/20(金) に行われた、Machine Learning Production Pitch #4 x ML@Loft #6 に参加してきました。

mlloft6.splashthat.com

machine-learning-pitch.connpass.com

当日の様子は、Twitterハッシュタグ#MLPP#MLLoft でもわかります。

togetter.com

今回は、Machine Learning Production Pitch と ML@Loft との共催とのことでしたが、私は初参加でした!

本編

富士通研の時系列データ解析技術 梅田 裕平 氏 (株式会社富士通研究所)

資料

drive.google.com

私のメモ
各LTに対して「私のメモ」という項目で書きますが、概要ではありません。文字通りメモです。

所感
富士通研の方のお話をうかがう機会はほぼないので(初めてかも?)、とても新鮮でした! 天の声が聞こえて時系列データの方へ行ったのがすごいと思いました!

ゼロベースからの論文レコメンドシステムの構築 河合 俊典 氏 (エムスリー株式会社)

資料

私のメモ

  • エムスリー株式会社
    • エンジニアが80人くらい
    • 医療の不自由なとこをなんとかする
    • お医者さん7-8割の人が使っている
  • CIWorks
    • 医師限定のサービス
    • arXivTimes の医療版的なやつ
  • 論文のレコメンド
    • 2ヶ月前に「特にデータも評価も決まってないけど作って!」
  • 分野の重なりが多い
    • 合併症の範囲が広い
    • 希少疾患
    • ワードの揺れ
      • MR 5個くらいある!しんどそう
    1. 医師と論文の名寄せ
    2. ジャーナルごとに形式違ったりする
    3. 同姓同名いる
    4. unique id を振る
    1. 興味ワードの生成
    2. TF-IDFで医療用語タグ付け
    3. Label propagation
  • Elasticsearch
    • WAND(Week AND)検索
  • Content-Based Citation Recommendation
    • 糖尿病 ← 5割くらいの論文に出てくる
    • 引用、abstract、著者とかを使う
    • これでコールドスタート問題を解決
  • 2つのモデルで、最後にマージ
  • 評価は編集部の目視を基準にアドバイスをもらいつつモデル化
  • 引用数の遷移を評価指標、時系列

所感
エムスリー株式会社が想像以上に多くのサービスを提供していること、また医療従事者の7-8割が使っているというのがまず驚きでした。
特にデータも評価も決まってない状態から、2ヶ月でお一人でこれだけのしっかりとした推薦のシステムを作られたとのことなので、本当にすごい以外の言葉が出てきません。
医療分野でのNLP特有の問題も知れて面白かったです。
あと、gokart 気になります。

社内の XX に詳しい人を知りたい 押条 祐哉 氏 (ストックマーク株式会社)

資料

私のメモ

  • ストックマーク株式会社 stockmark.ai

  • BERTやELMoの日本語モデルの配布などもしている

stockmark.ai

stockmark.ai

  • Anews
    • ビジネスニュース配信
    • チームの人が読んだ記事も読める
    • コメント機能あり
    • チームの共通知のアップデート!
  • 特定のキーワードやニュースで検索した時に、その分野に詳しい社内の人を推薦するエンジンを実装した stockmark.ai

  • 使うデータは、text (本文、記事タイトル、URL) とテーブル(ユーザ情報、ユーザアクションのログ、記事のメタデータ

  • コンテンツーベースでやった
    • 別用途で使用していたユーザベクトルがあった
  • ユーザベクトルと記事ベクトルのcos類似度
  • 記事ベクトル
    • 各記事のタイトルと最初の導入部分の名詞数単語をfastTextでベクトル化
  • バッチ処理とオンライン処理
  • 課題
    • コールドユーザは?
    • 他にも取れるデータで有効なものを探す
    • 評価指標
      • ABテスト、オンラインテスト

所感
ストックマーク株式会社の方の発表を聴くのは初めてで、前からどんな事されてるか気になってはいたので良い機会でした! かなりの短期間で実装されたとのことなので、使えるもの(既存のユーザベクトル)を使ってたり、記事ベクトルを作る時にタイトル+α だけ使ってたり、といった部分に機能としてスピーディーにリリースする工夫を感じました。 今後データどう変えるのかとか手法自体を変えるのかとか、評価どうするのかとか、色々気になるので、個人的にはまた発表聴けたら嬉しいなと思いました。

ESG評価を支える自然言語処理基盤の構築 久保 隆宏 氏 (TIS株式会社)

資料

私のメモ

  • ESG(Environment, Social, Governance)
  • 評価機関が複数あり、各評価機関のスコアに相関がない(本当に全然ない!)
  • 数十から百ページ、マンパワーでやるの大変 → NLP
  • 文書データの収集
    • AWSによる収集基盤構築
    • 作成したデータ5年分を近日無償公開するらしい
    • 企業がどういうことを書いてると株が上がったりするかみたいなのがわかる!
  • 評価対象となる文・段落の絞り込み
  • 課題
    • 各社各様の場所・仕様で公開しており集めにくい、解析しにくい
    • ESG評価、見た目は関係ないので綺麗なのより解析しやすいのを書いて欲しい
    • 自社内にデータなければ端正にデータを集めることがスタート地点?
    • 営業とフロントもインフラもやった!

所感
私自身にとってはあまり馴染みのないESG評価の話でした。かなり地道な努力をして取り組まれていていらっしゃったのが伝わってきました。

ディスカッション

普段は参加者も交えたディスカッションをしているそうなのですが、今回はLT登壇者の方々のパネルディスカッションでした。 Slido の質問に答えていただく形の進行でした。

TDA for time-series 興味深いです。 SARIMAなどの古典的手法、LSTMなどの深層系列モデルなどと比較したときの利点・欠点などをお伺いしたいです。

梅田さん

  • 予測というよりは分類とかに使う

MLチームの開発方法論って確立してきてますか?もしくは皆さんのチームはどうされてますか?

押条さん

  • ストックマークだと40人中5,6,人がMLで3サービスくらい
  • 個々人で責任持ってやる

河合さん

  • 再現性とか(パラメタとっとかないといけないよね)とか議論決行されてるし確立できてきた
  • Jupyterからそのままデプロイの会社もある。pipelineのossもあるし。ベストプラクティスは場合によるので難しい

梅田さん

  • 個人による?仕組み化したい

久保さん

  • 方法論の文脈によって違う。社内のデータ活用、jupyterの管理ノウハウ、プロダクトに入れる、MLopsをいかに早くするか

どこまでプロダクト寄りのことをすべきか?

久保さん

  • 全部やるメリットは何がいいのかわかる

梅田さん

  • 一人でやると回らないことも、企業による。

  • 一人でやった方が理想どうりにはなると思うけど、得意不得意もあるので分業でもいいかも。

河合さん

  • ヤフーは全部別
  • エムスリーだとデプロイもやるし、問題あれば営業巻き込んで解決、アラート出たら自分で解決。

押条さん

  • エンジニアが20人もいないとこで分業だと回らない。インフラ、バックエンド、フロントエンドとか分かれてる。API化してデプロイするところまではやっている。会社で決められてるならどうにもならないのでは?

研究成果の事業貢献は?

梅田さん

  • 結構PoCを長々やってしまう。課題を感じている、なかなか事業貢献できない

ML系アルゴリズムをオンラインテスト(A/Bテスト)に乗せるかどうかの判断をどのようにしていますか? to みなさん

河合さん

  • ABテスト大好き!目的を一つにすることを大事にする。オフラインだといろんな指標を見るけどオンラインは1つだけ。それを達成するためのオフライン指標はたくさん持つの大事。RecSysでも評価指標を目的にしてしまったらダメだって話があった。

久保さん

  • 強化学習の文脈でABテストの話聞くけど、ABテストまで行けばいい方。オフラインで足きりしたりとかはしてない。ユーザ数1%とかからテストしていく

河合さん

  • 1%とかでちょっとのユーザーで始めるの難しくない?本当は勝ってるかもしれないのに

司会

  • ビジネスKPI定量化するのって普通なの?

河合さん

  • 好きだからやってる、難しいとも思う。現場に行く、アンケートとる

久保さん

  • 好き。結局答えがないと何を目指していいかわからない。
  • チームマネジメント、評価でも使う。
  • 海外の成功してるスタートアップはビジネスKPIと機械学習のは比例している、Uberとか

オフラインで良くなったけどABテストで悪くなったとかとの場合どうなる?フィードバックとか...... 河合さん

  • エムスリーはテックブログにも書いてるし、大事にしてる 

久保さん

  • 広告だと種類によってある。オフラインのデータのバリエーションを増やしておく。オンラインだとキャンペーンとか影響があることも。評価シチュエーションを増やす。

押条さん

  • 営業ストーリードリブン。ビジネスKPIとはまあ連動してるかも

河合さん

  • 営業ストーリー難しくない?実際それユーザ嬉しいのみたいなのない?落とし所をうまくつけるのが機械学習エンジニアみたいなところある?

梅田さん

  • 最初から評価指標聞き出せないとかある。お客さんがイメージしか語ってくれない事があって大変

おわりに

今回は、自然言語処理や時系列データがどう実際のプロダクトで実装されてるかといったお話が聴けて、勉強になりましたし楽しかったです! 最近NLPしていないので、また久しぶりにちょっとNLPしたくなりました。

「真冬こそ激アツの自由研究LT大会」で登壇してきた

はじめに

2/22(金)に開催された、「真冬こそ激アツの自由研究LT大会」というイベントで登壇してきました。

engineers.connpass.com

どんなイベント?

エンジニアの登壇を応援する会が主催するイベントです。
この自由研究LT会では、技術に関係無いLTをします。登壇経験が無い人や浅い人が登壇しやすくなっています。リハーサル会と振り返り会があって、スライドの構成やデザインも見てもらえます。
私はリハ会も振り返り会も、どうしても外せない予定とかぶってしまい、残念ながら出られませんでした。

このイベントに登壇枠で参加した理由

LT登壇にまだ慣れていないので、技術関係ない話でのLT経験を積みたいと思い、申し込んで参加しました。
そもそもLTをしたいと思ったきっかけは、昨年末の「エンジニアの登壇を応援する忘年LT大会」に一般枠で参加し、いろいろな方のLTを聞いて、私もLTをしてみたいと思ったからです。これまでもLTを聞く機会は数多くありましたが、ようやく決意ができたといいますか、背中を押してもらえました。

今回は、私にとって2回目のLTでした。抽選になるほど大人気なイベントなので、抽選通って本当に良かったし嬉しかったです。
ちなみに、初めてのLTは、「もっとアウトプットしていこう!」というタイトルで、以下のイベントで行いました。
supporterzcolab.com

どんなLTをしたか

エスカレーターの話をしました。
かき氷の話と迷ったのですが、冬にかき氷の話は季節外れだと思ったのと、エスカレーターの方が他の人とかぶらなそうだと思ったからです。ちなみに冬にかき氷を食べられるお店はありますが、私はかき氷は暑い時期にだけ食べたい派です。

発表スライド


良かったこと

結構マニアックな内容だったのではないかと思うのですが、たくさん質問をいただけて、嬉しかったです!
知らなかったことも色々と教えていただきました。

おわりに

人前で話すことによって、反応をもらえたり、新たな知見を得ることができたりするのは、技術の話でもそうでなくても、一緒なのだなと感じました。
今度は技術の話でLTに挑戦したいです!