私は社会人経験者です。
東京国税局で税務の仕事に4年間携わったのち、退官して東京理科大学の数学科に入り直しました。
大学に入り直したのは、ひとつは量子生物学のある分野に興味があって、それを研究したいと思ったこと。
もうひとつは、税務の仕事に一生携わるのではなく、データを扱い、ある集合の特性を分類したり、予測をすることを自分の仕事にしたいと思ったからです。
インターンを始めた動機は、学費を稼ぎたいということもありますが、一番は分析とコーディングを自分の力にしたいと思ったからです。
実務の世界は勉強とは大きく異なります。
「学習」と「実践」この幅をいかに縮めるか。これがインターンの魅力だと思います。
大学で数学や統計学をどれだけ勉強したとしても、実務の場で応用するということは並大抵ではありません。
ラプラス変換を用いて、難解な微分方程式を秒で解けたとしても、実際に現実の物理現象にアプローチできなければ何の役にもたちません。
これと同じように、重回帰分析を始めとした難解な統計学の分析手法にどれだけ詳しくても、それを実際に使えなければ意味がありません。
かっこは自分の知識や能力を実践する場だと考えています。
身についたのは次の2つの考え方です。
1. 「論理的にできること」と「自分にできること」を分けて考えること。
2. 「人がやる仕事をできるだけ減らす」という癖。
「河波さん、これってできると思う?」
とよく聞かれます。
「どうですかね。大変そうですね。」と答えます。
なぜなら、実装するとなると、どんなコードを書けばいいのか、どういう分析手法を選べばいいかわからないからです。
社員の方は、
「いやそうじゃなくて。論理的にできるかできないかを聞いてるんだけど。」
問題の本質はここにあります。
難問と思われることに直面したとき、今の自分には具体的なアプローチが思いついていない、具体的な能力が備わっていないということはよくあることです。
しかし、そこで立ち止まっていては、物事を前に進めることはできません。
論理的に考えてそれが実行可能かどうかというのは、具体的な手法が思いついてない段階でも考えることができます。具体的な手法は後から考えて思いつくものです。論理的に可能なのですから。
この考え方は重要です。
なぜなら、大概の難題を解決可能にできるからです。
かっこでは多くの作業が限りなく自動化されています。
大変重要で手間のかかる作業をたったひとつのシェルスクリプト やpythonファイルを実行するだけで済ますことができる。
すばらしいと思いませんか。
あるいは、その実行さえ、日や月に1回自動で実行されるようにしておき、完了メールが送られてくるようにすれば、人間はそのメールをチェックするだけで済む。
「これって効率化できないかな?」
「これは自動化できるから、よろしく」
と日々要求される環境で、「人がやる仕事をできるだけ減らす」という癖が身につきます。
先輩方やスタッフの皆さんとやりとりをしていくうちに、自分の考え方と違う点があるなと自覚することができました。
うまくいかなかったなと思ったときや、逆に評価を受けたときを振り返ることで今の自分に必要な考え方が自然と身につくと思います。
日々、限られた工数(作業時間)の中で、「早く効率的に」「早く効率的に」と求められる環境だからこそ自分と違う考え方を強く意識して、身につけることができます。
何より、それを指導してくださる先輩方やスタッフがいます。かしこい方々からかしこいやり方を日々学ぶことができます。
また、以下のような経験を積むことができるので、具体的なスキルも身につきます。
・PythonやRを使って統計学、機械学習の手法をビジネスの分析に用いること
・AWSを利用して、Webアプリケーションの開発・保守
・SQLを使ってアプリケーションのデータベースの保守・運用
私はビックデータを人々の身近なものにしたいと思っています。
「The Pudding」というサイトをご存知でしょうか。
https://pudding.cool/
「The Pudding」は衆目を魅くデータを、極めて「美しく」可視化し、アイディアを共有するエッセイサイトです。
なかでも私が一番好きな可視化は「Film Dialogue」です。
2000の映画のセリフをジェンダー別で抽出して、可視化したものです。
瞬時に、映画のセリフのジェンダー比を理解し、しかも、ひとつひとつのドットにカーソルを合わせると、その映画のタイトルと個別の比率がわかります。
ちなみに、ディズニー映画に限定すると、男性のセリフの比率が最も高いのが「ジャングルブック」で、女性のセリフの比率が最も高いのが「眠れる森の美女」。
今ビックデータは、データなど触ったことのない人たちにとって、あやふやでよく分からない雲のような概念だと思います。
それを、実際に「見て」「わかって」「たのしい」ものにする。
これが、これからのデータサイエンティストに求められる能力なのかなと思います。
元公務員。 大学に通いながら、データサイエンティストのアルバイトをしています。 他に、発達障害児童向けの相談サービスの手伝いなどもしています。