かばやん's だいありー

かばやん's だいありー

学んだことをゆるゆるアウトプットしていきたいです。

yukiCup2023summerに参加した

はじめに

2023/07/30(日)に行われた、yukiCup2023summerに参加してきました。

www.kaggle.com

当日の様子は、Twitterハッシュタグ#yukiCupでもわかります。

本イベントは、内輪のデータ分析コンペで、オンサイト・オンラインのハイブリッド開催でした。 私はオンラインで参加していました。 期間は1日(8時間)で、お題は「中古バイクの販売価格予測」のテーブルデータのコンペでした。

結果

42チーム中42位でした!つまり最下位!

ベースラインは超えたかったなあ。。。

参加記事書く意味あるの?

有益なソリューションは書けないかもしれないけど、コンペ参加者にはそれぞれのストーリーがあるので意味があると思っています。そもそも書きたいから勝手に書いています。 まあ読みたい人は読むし、読みたくなければ多分そっ閉じするので問題ないと思います。

反省

  • 特徴量選択を全然真面目にしてなくて、とりあえず突っ込め〜だったのがよくなさそう(baselineで使われている特徴量に、自分で作成した特徴量を加えていく形でやっていました。特徴量足していくの楽しいんだもん……)
  • 作成する特徴量の優先度づけを一切していなかった
  • テキストデータ扱うの私には無理〜と諦めてbike_title入れなかったが、今思えばできたと思うので、自分を信じる心が大事と学んだ(bike_titleの長さと単語数はbaselineにあったので入れた)
  • Local CV と public LB の差が10以上あったけど解決できなかった

感想

たまにふらっとデータ分析コンペに参加するけど長期間だと身が入らない私にとっては、1日はちょうど良かった気がします。

データ分析コンペでいい順位をとったことないので、「私ってコンペ向いてないのでは?仕事ももっと賢い人々に任せてやめた方がいいのでは?」という時間が毎回あります。かなり身を入れて取り組んでいたと言える時期が一切ないものの、8年もデータ分析コンペから完全には離れてないので、多分きっと今後も参加はやめないんでしょうね。

本コンペはKaggle GM, Master, Expertが多かったと思いますが、普段Twitterを中心にからんでもらっていたりツイートを読んだりしていて、彼らが私と比べて取り組んでいる回数・かけている時間・手数が段違いなことは知っているので、私自身は向いている向いていないを判断するところまで来てないよな〜というのをいつも思います。

今回は、くやしい!と思えました。悔しいと思うとこまで来たというのはある意味成長だと思います。雲の上の存在に対して嫉妬心を抱かないのと同じように、自分も戦っていけるのではないかと思えないと、悔しいと思えないと思うのです。

こんなに強い人いっぱいいるコンペに誘っていただいて、光栄でした!ありがとうございました!この場を借りてお礼を申し上げます。 私は常々「ボドゲはボコられるのが好きなので強い人とやる方が好き」と言っているけど、それと同じですね。データ分析コンペの開催するのかなり大変そうですし、こういった機会作ってもらえてHappyです。でもくやしい!強くなりたい!!

自分なりに成長はある

過去にatmaCup4の参加記事を書きました。 その後atmaCup8も真面目に参加していたのに、記事書いてなくて記録残っていなくてくやしい!

kabayan55.hatenablog.com

環境構築ができない・モデルを実装したもののデバッグが終わらなくて結果出力までいかない・サブミッションエラーあたりからは解放されるようになってきたので、進捗だと思います。 データを眺めたり自分で特徴量作ったりするのが楽しいのに、その前に止まっちゃうと楽しい部分を味わえなくて楽しくないんですよね。 初心者向けの説明があったり、baselineのnotebookを公開してくださったりがあるおかげで、そういう悲しさを回避できる環境は整っているので感謝しかないです。他の人が書いたコードを理解して改良していくのを短時間でするのは苦手なので、自分の書いたコードに追加していく方法でやることの方が多いかもしれません。

過去のatmaCup8参加時の自分のnotebookを見ていると、かなり目標が低いなと感じるようになってきたので、昔よりは前を向けるようになってきたなーと思います。

突然の褒めタイム

皆さんにとって、もう当たり前になってしまったかもしれないことも、私から見るとかっこいいので、せっかくなので褒めようと思います。 一人一人に伝えるのは気恥ずかしいからね

  • サブ速いの、かっこいい!
  • 結果出していて、かっこいい!
  • ディスカッション投稿するの、かっこいい!(ありがたい)
  • ソリューションわかりやすくDiscussionに投稿してくれるの、かっこいい!(ありがたい)
  • 最後まで諦めずに向き合うの、かっこいい!
  • Late Subしていて、かっこいい!
  • 復習していて、かっこいい!
  • 参加記事書いてて、かっこいい!

楽しんでいて、かっこいい!

以上です。

おまけ:本コンペに参加して、バイクに乗りたくなったか?

自転車の練習を小2あたりまで続けたが、こげるようにならないまま放置しているので、まずは自転車をこぐ練習からします。 1日のコンペで画像データがあったらお手上げだっただろうなと思う一方で、画像見てたら乗りたくなったかもしれないと思いました。

本コンペの、他の参加者のブログ記事

teyoblog.hatenablog.com

zenn.dev

zenn.dev