Yuxio Blog

かつどうきろくやおもったこと

10月1日(日)データ分析・機械学習LT会1stを主催しました

 

f:id:yuxio:20171006013343j:plain

データ分析・機械学習LT会 - connpass

 資料はこちら

daml.connpass.com

目的

・データ分析者・機械学習エンジニア等、 データに関わる業務を行う職種同士が互いの知識やスキルの見識を深める

・データ分析に興味はあるが具体的な内容がわからない一般参加者に向けての理解促進

有識者、一般参加者同士の気軽な情報交換

 

準備

・登壇者とTwitterグループで進捗確認等連携

Googleスプレッドシートで登壇者の環境、当日のスケジュール、参加者リスト、

当日の細かい段取りなどのチェックリストを管理

 (登壇者と連携するのにGoogleスプレッドシート便利)

開催

キカガク設立までの経緯

 

Rでもできる 日本語テキストマイニング

 

 

 pysparkでレコメンドエンジンを作る

 

 Jupyter(Python)とBigQueryによるデータ分析基盤のDevOps

 データ分析で最初にやること

Pythonの深層学習フレームワークChainerのコミュニティ活動をしていらっしゃる

舛岡さんからの飛び入り参加もありました

 

 

 

当イベントは宗教戦争を禁止しております

 

懇親会

 

 

 

 

振り返り

 

アンケート結果

参加者9名中8名の回答を得ることができました。

皆様ありがとうございます!

 

f:id:yuxio:20171006010058j:plain

f:id:yuxio:20171006010111j:plain

f:id:yuxio:20171006010124j:plain

f:id:yuxio:20171006010132j:plain

f:id:yuxio:20171006010144j:plain

f:id:yuxio:20171006010153j:plain

f:id:yuxio:20171006010202j:plain

f:id:yuxio:20171006010211j:plain

f:id:yuxio:20171006010221j:plain

f:id:yuxio:20171006010231j:plain

 

 

 

良かった点

・発表内容と懇親会に「大変満足」の評価を多く頂けた
・人数が少なかったことで登壇者と一般参加者の距離が近く気軽に質疑応答できた
・LTが10分程だったのでテキパキ進めれた

・LT後の質疑応答の時間では、質問が多く出ていて活気的な雰囲気であった
・発表内容が、目的設定、手法、業務寄りの実装まで幅広くレベルが高かった


反省点

・登壇者4名の当日ドタキャン(しかも連絡なし・・)
⇒はやめはやめに連絡をするのが一番かなと思いました。

 ・ハッシュタグがあまり使われておらず記録があまり残せれなかった。

(その分皆さん集中しておられてよかったです。)

 

個人的にうれしかったこ

・仕事場・ハッカソンSNSもくもく会などでつながった方々が

こうして結集?している場を見れたのは感慨深いものがありました。縁大事。

今後やりたいこと

データ分析関係のイベントでは、

「データ分析・機械学習のつらみを話す座談会」をやりたいなぁと考えております。

 

 

f:id:yuxio:20171006011308j:plain

 

 

上のように、現在、世間の一部の方面では、ディープラーニングやデータ分析に対して

なんでもできるだろデータ渡したらと過大な評価をしている方々がいらっしゃいます。

セミナー・参考書籍・ライブラリにもともと入っているサンプルデータを使用したりすると、簡単なものであれば、PythonやRなどで1人で簡単に実装ができてしまいますし、

結果を見ると、万能感のようなものも生まれます。

しかし現場はそんな簡単にできません。

生のビジネスデータは、欠損値がーとか当年と一年前と二年前とで

名前は違うけど同じものさしているよーとかデータの偏りがあるよーとか

そのままではまず使えません。

そこで、データがどういうものか俯瞰的に確認したり、値に適切な処理を行う前処理を行ったり、そうした下準備をまず行います。

その後、モデルをつくって、精度が高くないならもう一回何が悪いのか考えてやりなおしてみて・・を繰り返します。

その中で、前処理がつらい、お客様が求めているほどの精度が出ない、というかサンプル自体少ないんだけど?という「つらみ」が発生してしまいます。

 

現状、PythonやRで気軽に実装できる体験セミナーを実施して、

機械学習で予測とかこんな簡単にできちゃうんだよ!という万能感を与えているばかりに

「なんでもできるんだよね?」という誤った認識を持たれてしまっているのではないかと考えています。

見方の偏りを正しくするために、負の側面も見せないといけないなぁと思いまして、

つらみ座談会をいつか開ければなぁと思います。