かばやん's だいありー

かばやん's だいありー

学んだことをゆるゆるアウトプットしていきたいです。

Women in Machine Learning @Google Japan に参加してきた

はじめに

本日2019年1月26日(土)に開催された、Women in Machine Learningというイベントに参加しました。
www.meetup.com

本イベントの主催は Machine Learning Tokyo というよく機械学習関連のイベントを行なっている団体と、Google Japanです。私自身はMLTのイベントは初参加でした。

machinelearningtokyo.com
www.meetup.com

全てのトークは英語だったので、英語で感想を書こうかなと思ったのですが、一旦日本語で書きます。
余裕があったら英語版も書きます。

資料は現時点ではどなたも公開していらっしゃらなかったようでしたので、載せていません。

感想

1. "Handling Gender in Google Translate", Anja Austermann, Software Engineer, Google Japan (Google Translate)

以下のブログを始めとした、いくつかの記事でこの話を以前に読んだので、ちょうど気になっていました。
www.blog.google
翻訳において、性別の部分の対処は一筋縄でいかないことも多くて大変だということがわかりました。
性別が決まっている単語(e.g. wife)もあれば、無い単語(doctor, manager, nurse etc.)もあります。
また、言語によって、男性か女性かで違う単語を使っていたり、男性でも女性でも一つの単語で表現できる場合もあります。
気にしすぎると性別関係ない部分にも性別の表現が出てきてしまったりするみたいです。

2. "Machine Learning in Space", Danielle DeLatte, PhD in Aerospace Engineering at the University of Tokyo

クレーターの検出をアンサンブル学習でして、可視化もしたというお話をうかがいました。
航空宇宙でどうMachine Learningするかといったお話を聞く機会は今まで全然なかったので、すごく新鮮で、面白かったし自分自身も分析してみたいという気持ちになりました。
分野が違えど、すること自体は一緒なんだなーと思ったり。
航空宇宙に関するデータ分析をしたい人は、以下のデータセットが使えるようです。
archive.stsci.edu
pds.nasa.gov
www.kaggle.com

"End-to-end Pre-modern Japanese Character (Kuzushiji) Recognition with Deep Learning", Tarin Clanuwat, Researcher at the Center for Open Data in the Humanities, National Institute of Informatics

Kuzushiji は、「くずし字」です。古文書で使われているくずした形で書かれている文字です。
今くずし字を読める人は、日文と歴史の研究者、書道を習ってる人くらいみたいです。
私は読めません。
アノテーション大変だという話を聞きましたが、確かにそもそも読める人が少ないのに行ったり頼んだりするのは大変ですよね。
くずし字のことはよく知らず、初めて聞く話だったので、とても新鮮でした!
ひらがなも漢字も、元々一つの字に対して書き方がたくさんあったというのが衝撃でした。
現代に生まれて良かったです。笑
絵の書いたものに文字が書かれていたり、全て縦書きで読んでいけばいいという訳でもなく、ブロック(段落?)がダイナミックにオシャレな感じに配置されていたり......。
ひらがなの「く」と「くの字点」がとても似ているのですが、私には見て違いがさっぱりわかりませんでした。


Data Setがあって、Kuzishiji-MNIST、Kuzishiji-49、Kuzishiji-Kanjiというのがあるそうです。
www.lyrn.ai
www.kaggle.com

"How to become a data scientist", Etsuko Tane, Market Researcher, BrainPad Inc.

データサイエンティストの女性は、O'Reillyの調査によると世界で20%、データサイエンティスト協会の調査によると日本だと12%だそうです。もっと増えるといいなと思います。

データサイエンティストになるメリットとして以下の3点を挙げていらっしゃいました。

  1. バックグラウンドはCSや統計でなくても良い
  2. 世界のどこでも仕事を探せる、働ける
  3. 年収高い

実際に仕事では、私自身も、いろいろな分野の出身の人たち、様々な国籍の人たちと現在仕事をしてます。
これは1. や 2. の恩恵だと思います。

データサイエンティストのスキルセットは大きく3つにわけて、「ビジネス力」「データサイエンス力」「データエンジニアリング力」です。全て完璧に身につけるのは難しいと思われるとのことでした。同感です。
よく見る図のやつですね。
prtimes.jp

おわりに

パネルディスカッションの時間があったのですが、質疑応答が活発で20以上質問が出ていました。
Machine Learningに携わる活躍する女性の方々のお話を聞けて、大変刺激を受けました!
参加者同士でも交流することができ、有意義な時間を過ごすことができました。