今更ながらデータサイエンティストを名乗ろうか?
なんか世の中データサイエンティストっていうのが花盛りです。
風太郎はその言葉が流行る以前から、産業における統計学の活用を専門にしています。
それでも、「データサイエンティスト」と名乗りたくない面もあります。この言葉だと「単にデータを分析する人」っぽいじゃないですか。それであまり言いたくないのです。分析者はデータ分析を武器としてビジネス課題を達成する人であるべきと思っています。そのため、「問題解決屋」と名乗っています。そのこととから、あまりデータサイエンティストと言いたくなかったのです。ところが昨今猫も杓子も「データサイエンティスト」と叫び続けているようです。
そのアンチテーゼみたいな形で「問題解決屋」としてこのブログ始めてみました。そう言ったことから「データサインティスト」というのか「問題解決屋」と名乗るか悩んでいます。
データの産業への活用
これは決して新しいことでなくて、歴史上一番古いのは19世紀にビールのギネス社が活用していました。有名なゴッセル氏は統計家して採用されたので、その時にはギネス社としては活用の有効性がわかっていたのでしょう。
またフィッシャーも20世紀初頭です。また、テストの偏差値にも用いられている正規分布(ガウス分布、ベルカーブ)は18世紀の発案です。このように統計活用の歴史は古いものです。
その後は熟練工のいない対戦中のアメリカで採用されて、日本にもデミング氏が広めました。(参考文献1)
デミング賞というは改善の活動として有名です。しかし、デミング氏が広めたのは統計的品質管理でした。これはデミング氏の講演録に記載されています。幸い風太郎はそれを読むチャンスに恵まれました。デミング氏はシューハート(管理図で有名な方)氏のお弟子さんです。そのため、管理図関係の話も言及していました。
仕事に必要なことは?
分析をした結果、どのような利益ができるのか?これは大変重要なことです。ただ、だれでもそうじゃないといけないとは言いません。当然、論文を書くような仕事を行う人、論文から実装トライを行う人などが必要です。しかし、こう言った人たちの給料を稼ぐためにはどこかで利益を出す必要があります。
”参考文献2"はそのようなことが書いてあります。この本は企業に研究者のような人は不要というような意味合いともとることができます。これは言い過ぎだとおもいますが、放置するとひたすら意味のないデータ分析を行うことになりかねません。
問題解決の重要性
「問題解決」っていう言葉が誤解を招きます。問題解決の本質は”どこに手を打つか?”を見つけることにあります。これは「問題解決」だけでなく、多くの方がそう述べています。先ほどの参考文献の河本先生、CRISP-DM(ビジネス理解が最初に来る)、品質工学の田口玄一先生(この先生は”あなたの本当にやりたいことは何ですか?”と尋ねます)、田口先生のお弟子さんの矢野先生(”それは願望だ、技術課題は何だ?”と尋ねます)、TOC(制約理論)では「何を何に変える?」という言葉があります、これも同じ意味でしょう。
そういう点で分析者の必要なことは、どういう分析を行えば問題が解決するか?利益が上がるか?ということです。それをよく考えて分析を行うことがデータ分析者の役割だと考えます。
同じような主張をはてなでも見つけました。
kawaguti.hateblo.jp
風太郎の主張と異なっているのは、データサイエンスとプログラマの違いの他に、「知識」なのか、その活用「プロセス」なのか?というところです。これはこの方が間違っているのでなくて、表現の違いのようなものだと考えます。
今後のデータ分析の必要性
今データ分析やプログラミングの参入障壁が下がっています。この点は別途論じていきたいと思います。今後は実務者がデータ分析や分析のためのプログラミングを記述したりしていくことになるでしょう。この点については今後説明していきたいと考えています。
参考文献1
- 作者: ピーター F ドラッカー,牧野洋
- 出版社/メーカー: 日本経済新聞出版社
- 発売日: 2009/07/01
- メディア: 文庫
- 購入: 9人 クリック: 25回
- この商品を含むブログ (18件) を見る
参考文献2
- 作者: 河本薫
- 出版社/メーカー: 日経BP社
- 発売日: 2017/11/24
- メディア: 単行本
- この商品を含むブログ (1件) を見る