データ・サイエンスについて素人ながらに思うこと
データ・サイエンスは「なんとなく」を駆逐する
最近データ・サイエンス的な仕事のそばにいたりする。
そうすると必要に迫られていろいろ本を読んでみたりしてインプットしたり、自分でもcoraboratory使ってEDAしてみたりちょっと分析してみたりするわけだけど、なんというかデータ・サイエンスは今私にとって「なんとなく」を駆逐できる武器という感覚を持っている
- データ・サイエンスは「なんとなく」を駆逐する
- 組織の毎日には「なんとなく」が実は溢れている
- データ分析できなそうなものでも、分析できるらしい事に一番驚いている
- とにかくまずは構造化データをたくさん集めること
- データがないから「なんとなく」になる
組織の毎日には「なんとなく」が実は溢れている
どれだけロジカルな組織で、どれだけ数値管理を大事にしていても、「定性的」とか「印象」とかいった「なんとなく」や
思考しきられたように見える意思決定の中に潜んだ「慣習」「思考停止」みたいなものが必ず存在するなーと思っていて
その当たり前や雰囲気みたいなものにも疑問を呈することもできるし、逆にその正しさをある程度客観的に評価できたりするのもデータ・サイエンスだなあというのを考えていたりする。
データ分析できなそうなものでも、分析できるらしい事に一番驚いている
定性的な判断や評価、組織の雰囲気や勢い、ある施策や新しい取り組みの成功確率などなど どうやって分析していいのかわからないなーというものでも、意外とデータ化できるし、分析もできるらしいというのが最近勉強した流れの中で感じている事。
データ分析するならば、データを構造化データとして入手することがファーストステップだろうと思うのだが、構造化データ化の作業は思っていたよりも柔軟で。定性的なデータでも構造化して様々な分析がかけられるみたいだ。
例えばマネージャーのマネジメント力、みたいな定性的になりがちな能力でも、とりあえずは周囲の評価などから一旦スコア化するとかでも結構役に立つデータになるようだ。
とにかくまずは構造化データをたくさん集めること
構造化されたデータは、SQLがある程度扱える程度でも結構分析ができて、仮説検証などに役立つ。
まずは構造化データをたくさん集めてそれらを繋ぐこと。
これは結構重要だと思う。「これは役に立たないんじゃないか」みたいな感じでデータの出し惜しみをしちゃうと分析の幅も狭まってしまうしよくない。
まずはデータがたくさん集まってくる状態を作るのが、データ・サイエンスを業務に活かしていくファーストステップな気がする。
データがないから「なんとなく」になる
とくに組織側に関して、「なんとなく」ってまだまだ多い気がしていて。事業側はKPIとか追っていく文化が結構作られてる印象。
「なんとなく」の例としては
- この人はマネジメント経験ないし、なんか物静かだからマネージャーは無理そう、なんとなく
- 評価の仕組みってまあどこもだいたい半年に一度だし、なんとなくうまくいってそうだから今のままの運用でいいよね
- なんか退職者多いけど、これまでもそうだったし多分一般的にそんなもんでしょ
みたいな。意外とこういうの、過去データ可視化するだけでも「ああ、なんとなくで判断してたみたいだね」とかの気づきは与えられる気がしていて。
いろいろなところで言われていることだけど、まずは存在するデータをちゃんと把握して可視化できるようにしてみるだけでも十分価値があるのではないか、と。データ・サイエンスと聞くとどうしても機械学習、予測分析、クラスタリングとか派手目なアウトプットを期待してしまいがちだけどそれだけじゃないよという。
派手なことやる前に、身の回りの「なんとなく」駆逐するだけでも、データ活用できてるって言えるんじゃないですかね?