OFFICE風太郎

日本のエンジニア、風太郎です。問題解決が飯のタネです。仕事や生活で問題解決を活用したり、問題解決の基礎となる統計とかデータ分析の話をしていきます

【データサイエンス】データ分析環境について(WinPython編)

初学者にはお金が不要で構築できる環境を

 今からデータサイエンス(データ分析)をしようとしている人がソフトを購入するのは大変です。そのためここでは 「簡単に」 手に入れる方法を説明します。  以前に データサイエンスとその環境について(無料環境) - OFFICE風太郎google colaboratoryを紹介しました。しかし、自宅勉強ならともかく、職場ではネットで繋げないなどの問題があります。
そこで、自分のPCにインストールとなります。やはり、インストールなどは有償ソフトの方が楽だとも思います。  有償ソフトで個人で購入できる値段は購入できそうなのはMatlabのアカデミック版だけでしょうか?
 それを購入するために通信制大学・大学院の放送大学に入学する人がいます。しかし、アカデミック版は有償ソフトのメリットのサポートがないのが気になります。 当然会社のPCにインストールすることはできません。なかなか高価なソフトでそう簡単に購入できなかったりします。
そこで、多くの人はPythonやRなどのオープンソースソフトを使うことになるでしょう。

オープンソースソフト(無料)

 多くの人が、PythonやRなどの無料ソフトを使っています。これを無料というと多くの人が反発するでしょう。ただ、初心者にとって、勉強のために多くの費用が必要な恐れをなくすことが大事だと考えてこのような表現にしました。
 初心者にはオープンソースという言い方とかわかりにくくて理解されないことが多くあります。そのため無料ソフトという名称を用いました。
 突っ込みたい人はいっぱいいると思いますがご容赦ください。

おすすめはWinpython

 このブログでは WinPython を進めます。

 多くの人は www.anaconda.com

を使っています。  このAnacondaは大変よいパッケージ(ソフトウェアのセット)です。これを薦めるのは当然です。それでもあえて次のようなことを考えてこのWinPythonをお勧めします。

  • インストールそのものが不要(フォルダに展開するだけでいい)
  • そのためうまく動いた環境をそのまま他のPCに持っていける
  • ソースコード(*.Py)とセットで運用したらまるでアプリケーションのように運営できる

 と言ったメリットがあります。なぜこの環境を思い当たったか?それは次のような質問を受けたからです。
Pythonを.EXE化できないか?」ということです。状況をいろいろ伺うと上記のような対応でできることがわかりました。それを伝えたところ「私は.EXE化したいんでる」としか言われませんでした。これは問題解決の視点からかなしいですね。.EXE化というのは目的を達成する手段です。問題解決で手段そのものを変更するのはかなり有効な方法です。

Winpythonの企業でのメリット

 上記のことから企業でのメリットがかなりあります。 その活用シーンを考えてみます。

まず第1に
 「構築済みの環境を手軽に配布できる」
 ということがあります。意外とソフトのインストールと、ライブラリのインストールは大変です。さらにバージョンとか合わせることはもっと大変です。これをフォルダ一つや、zipファイル一つで済むから楽です。

続いて、
 「ソースコードとセットで配布することにより、アプリケーションの様に取り扱える」
 直接実行すれば、それがまるでアプリケーションの様に動作します。これは実務だけじゃなく、研修とかのデモ用にも最適です。

最後に
 「動作が安定する」と言うことです。
 レジストリを汚したりしないので、動作が安定します。また、複数バージョンの共存も得意です。PCになれない人は意外と細かい操作をミスります。そこで、この様な形態で配布するとトラブルが少なくなります。

 以上の理由により、企業とかでPCの扱いに疎い人が多い場合に有効な分析環境と言えるでしょう。

参考)現在Anacondaでの最新バージョンのPython3.7は色々不具合があるようです。そこで旧バージョンはAnaconda installer archiveでダウンロードできます。

おっさんがネット世代に衝撃を受けてみる

大昔のこと

 インターネットで知り合うのは危険とか言われています。じゃぁインターネットのなかった時代は安全か?というとそうでもありません。雑誌には「文通欄」というのがあり。郵便番号、住所、氏名が書かれて「お手紙待っています」という一文と共に掲載されていました。また、米国では新聞広告の形で文通相手を探していたそうです。これって危険だったと思いませんか?実際に米国の新聞広告は犯罪関係を調べている時に知りました。(真偽はわかりません)
 男女の出会いというのもナンパとかあって、初めて知り合った男女が車に乗ってどっかにいくこともありました。同性同士でも遊びに行った先で気が合って仲良くなって連絡先交換(住所、氏名、電話番号)なんていうのもあったんです。それに比べてインターネットが特に危険か?というと「相手の顔が見えない」のは怖いなぁっていう程度でした。実際性別すら偽ることができます。とはいえ、いきなり性別や住所を載せているような前述の例の方がずっと怖いと思います。
 おっさん世代はすぐ”昔はよかった”と言いがちですが、冷静に考えると昔より今の方が良いことが多いです。良くするためにみんな努力をしているのですから。

おどろいた一言

yuka-s.hateblo.jp「私の感覚からすると相手のSNSすら知らないで会う方が、よっぽど不安です。その人がどんなものに興味を持って、どんな人と繋がってて、何を発信しているかなど知ってから会った方が安心材料があります。」(ブログより引用)
 というのは正直衝撃でした。確かにその通りです。ブログとかSNSは知り合う以前からあるはずです。その中の自分を作ることは相当難しいことです。また、読むのは1人だけではないので矛盾はわかります。それも大きなところですね。
 こういうことをさらりと言ってみるところが若い人のすごさでしょう。歳をとるとそういう頭の柔らかさがなくなります。

実際世間ではどうか?

 多くの人はハンドルネームです。(風太郎もリタイヤするまではハンドルネームで通すつもりです)しかし、海外では実名が当然の国があったり、サービスによっては実名率の上がる(Facebook,Linked in)ものもあります。
 そういったサイトでは当然しっかりした考えを述べるものでしょう。そう考えてみると今までの履歴をちゃんとみて会うに値するかどうか?という判断もあるかと思います。
 一旦衝撃は受けてみたものの、ある意味合理的な判断かな?と思えます。でも最初は本当に衝撃を受けました。

AIによってもたらされる次の世界(ボカロの次は?)

(約1900字)

AI時代における生活

 風太郎の仕事の一つはAIの活用です。そのAI時代で多くの仕事がなくなるのではないか?と危惧されています。確かに多くの仕事はなくなるでしょう。反面多くの仕事も生まれていくことになります。そして多くの楽しみも生まれていくでしょう。
 ここでは仕事と生活について考えてみます。

20世紀の少年が見た未来社会とそのギャップ

 遥か昔、未来世界を想像することが流行っていました。それらの多くの想像では「人は単純作業から解放されて余暇を満喫」していました。
そして、知的なことにのみ集中できる。クリエィティブなことに集中できる。ということでした。
 現実としては「単純作業から解放」されてはいません。しかし、「クリエィティブなこと」を色々行えるようになってきました。
 例えばこのブログです。20世紀であれば、このようなアマチュアの文が人に読まれることはまずありませんでした。それを今読者様に読んでいただいています。 これは風太郎のブログだけではなく、多くの人のブログが多くの人に読まれています。また、ボカロ(ボーカロイド)によって多くの人の作詞、作曲した曲が配信されています。そのようにIT技術とインターネットの発展により、多くのクリエイティブなことが一般の人に解放されました。

期待する未来社

AIバブルがもたらしたもの

AIがまたバブルに終わる予感ー無知が殺す未来ー - OFFICE風太郎で、今はAIバブルじゃないか?と考えました。そのイメージを図にしてみます。 バブルの時は実態以上に期待が高まります。経済的なバブルと異なり、期待値ほどではないが、一気に技術が高まると感じられます。

f:id:FUTARO:20190309173158p:plain
バブルのイメージ

 具体的にはGPUの大幅な進化、日々arXiv.org e-Print archiveなどに発表される新しい論文。Scikit-learnなどのライブラリの強力な進化です。
 これらのツールが我々の生活の裏側で働いています。

GDPで測れない豊かさ

 風太郎はもうおじいちゃんと言われても不思議じゃない年代です。その実感からいうと日本はGDPで見た上では経済成長していないと言われていますが、実際はかなり豊かになったと感じます。例えば、携帯電話やパソコンの普及のこです。仮に、遠距離のカップルが月に3万円電話代を使っていた昭和時代と比較すると、今はLINEで文字のやり取りや無料通話として考えると、マイナス3万円程度の経済の低下です。しかし、その統計とは別にコミュニケーションの実態としてはどんどん豊かになっています。このように金銭だけでは測れない豊かさが21世紀だったと言えるでしょう。

AIのもたらす豊かさ

 今我々の生活の裏側では多くのAIが働いています。それが豊かさをもたらしています。では今後どのようになっていくのでしょうか?今風太郎が期待しているのは生成モデルです。それが今後我々を豊かにしてくれるのではないか?と考えています。

生成モデルの作り出す豊かさ

 生成モデルでは現在、グラフィック(キャラを作る)や情景(写真)、小説まで作れます。これは今のところ難しい操作が必要です。今後これが簡単になったらどうなるでしょうか?
 それに近いものがあると考えています。それは先ほど述べたボーカロイドです。ボーカロイドはそれまで歌手に歌わせることのできなかった人々に歌を作る道具を与えました。その結果、もうブームをすぎて定着の状況になっています。
 生成モデルは今まで作れなかったものを作れます。ひょっとしたら映画のようなものも作れるようになってくれるかもしれません。プロット与えると新しい小説を作るかもしれません。MMDなんかも簡単になるでしょう。そうすればもっとクリエイターが増えてくることになります。
 映画に例えるならば何億、何十億(円とかドルで)の制作費を用意しなくても机の上で作れるようになってくるかもしれません。そうすると映画の制作費は経済がダウンすることになりますが、様々な映画が出てくることになるでしょう。そのような未来社会を期待させます。

 

【Kindle】またもやセール

昨今の天気

 最近気候がおかしいですね、すごく寒かったりします。風太郎は恒例(?)の気管支炎で抗生物質を飲んだり吸入のお薬もらったりしています。さて本題です。

先月Kindle本を買いました

先日のブログ

futaro.hatenadiary.jp

で沢山本を買いました。それからいろいろあってお昼ご飯は家から持っていってます。
そんな中でやってくれました。
IT語学書フェア+ソフトバンククリエィティブキャンペーンの二つです。 どちらも50%前後の割引でした。危険です

結局

購入したのは次の通りです。たった3冊です。先月のでビビったのと、IT本の割引の高いのは古い本が多くあったためです。基本的なところは良いのですが、細かいところが最新のものでなくて、そういうところが知りたいため不適でした。

先月買おうかどうか迷ったけど、割引がなくて、買いませんでした。買わなくてよかったです。 今月安く買えました。出版前から評判の良い本です。

アプリを作ろう!  Visual C#入門 Visual C# 2017対応 (マイクロソフト関連書)

アプリを作ろう! Visual C#入門 Visual C# 2017対応 (マイクロソフト関連書)

C#は以前使っていました。最近のVisualStudioは難しくてこの本を購入しました。難しいというのは最初にプログラム作るためのプロジェクトの作り方すらわからないためです。

これはマジに肩が凝っているからです。

意外と買いませんでした。

もう一つの誘惑

この本が50%ポイントバックです。クトルフは若い頃凝っていたので懐かしくて読もうかどうか悩み中。読む時間ないから控えないと、、前に買った

も全然読んでない状況です。

【Ipad】NoteShelf2 x Evernoteでのエラー

起こったこと

 愛用のIpadProでNoteShelf2を使っていました。
他の製品と比べて、これを選んだ理由の一つが「Evernoteとの連携」です。 ところが、Evernoteのアイコンが赤くなってタップすると”Rate Limit Reached”と表示されています。EverNote側にもデータが保管されていません。連携が失敗しているようです。そこで調査をして解決しました。
 検索しても英文サイトしか出てこなかったため、英語苦手な人向けにここに書いておきます。

まずは結論

 しばらく待ってください。ということです。 待つ時間は1時間程度です

理由

Common Evernote Sync Error – Noteshelf Support

Noteshelf - Evernote Sync: Rate Limit Reached - Evernote Integrations - Evernote User Forum

これらのサイトによるとEvernoteは短時間にいくつかのリクエストが集中すると外部からのアクセスを切断するそうです。 次の時間(1時間ごと?)に回復するそうです。

それでも発生した場合は

 今回その時間待ちしていても再発しました。よく見るとアカウントがテスト的に作った無料アカウントに繋がっていました。無料アカウントでは連携はできないようです。
 こういうところを注意すべきでしたね。こういうミスはよくやってしまいます。

【問題解決・品質向上】唐揚げの品質向上を考察してみる

(約1600文字) この記事は

futaro.hatenadiary.jp

の続きになります。

料理はエンジニアリングである

 「料理はエンジニアリング」である。と考えます。
製造業をやっていると料理と全く同じ概念で行なっています。
同じようなところ

  • 完成されたものが定量的に定義されているー量・味も成分や状態で定義できる・盛り付け(荷姿)も大事
  • 材料の量や質が定義されている
  • その手順や道具が明確になっている

 といったところです。そういったところから風太郎は人に説明するときに料理を例題に持ってきます。

唐揚げの品質向上を振り返る

 唐揚げの品質向上では実際の問題解決と異なり、足りない部分が多くあります。ざっと思いつく限りは次のところです。

  • 結果が定量的に把握されていない。(実際の温度、時間など)このとき唐揚げの結果も写真などで目で見て判断してもいいかと思います。(目視検査、官能検査というものです)
  • 結果に対して原理原則を考慮して、なぜこうなったか?という考察がされていない。
  • 横展開(他のことに対してこの考えがつかえるかどうか)を考慮していない

 といったところです。なお「対策打つ前に検討や事前評価」ということもおっしゃる方もいます。通常は行いますが、今回程は「悩む前にやってしまった方が良い」ということです。この程度の事はやってみてから考えた方がいい、ということも多くあります。
 実務でも上記のことを考えて仕事していく必要があります。

この事例のポイント

 今回行いたいことは「美味しい唐揚げ」を料理することです。そこをその目標値とせず、定量的に測れることとしたのがポイントです。また、その目標値はシンプルであればあるほど、対策立案が楽になります。
 また、鍋底が平面なのがいいのではないか?というのは「勘」でもあるし、今までの技術的な経験に裏打ちされた「アイデア」かもしれません。そういった「KKD(経験と感と度胸)」は悪く言われることもありますが、仕事には絶対に必要です。(当然悪さもあるけど別の機会に・・)
 一番大事なことは対象をよく観察することです。また、それは内部を想像することでもあります。今回のポイントは単純に起きていることを見るだけでなくて、その内面を考えることです。今回は、構造を知って、その原理原則(電磁波の流れ)を推定することにより「鍋が平面なこと」という条件を思いつきました。  IHの原理は次のサイトのようになっています。

電磁(IH)調理器の原理ー電磁誘導の利用ー : 物理質問教室

このサイトを見るとわかるように、IH調理器は磁界がループしています。この原理を知っていたので、怪しいと感じました。反面、普通の加熱ならできるじゃないか。と言うのが反論理由になる気もします。
 今回はわざわざ投資したのではなくて、今あるものを使ったのでトライしてみる気になりまりました。新しく何か購入するのであればさらに深く考えたでしょう。

問題解決の第一歩

 何度繰り返すように、最初の現状を正しく観察することが大事です。「現地・現物」っていうやつですね。そこによく原理原則から現実を考えることです。
 反面、時々「現地現物症候群」ともいうべき病があります。何も考えなくても、知識がなくても現地に行って現物見ればなんとかなる。というタイプです。そういうことには気をつけるべきでしょう。
 経験などに裏打ちされた十分な知識や、考える能力があって、現地現物が役に立ちます。
 なんども繰り返しているように最初に観察した事実が非常に重要です。

【問題解決・品質向上】唐揚げに見る技術革新による品質向上

 ここでは製造業に置ける問題解決の事例を述べてみます。対象は料理の唐揚げですが、製造業に使えるように書いています。
 特に技術革新が品質向上にどのような影響を与えるか?そこのところも重視しています。

品質向上を目指すとコストが下がる!?

 この命題は昔より言われていることです。何度か中国の方に講義を行ったことがあります。最初の頃(中国のGNPが日本に届かなかった頃)は「品質をあげるとコストが上がるか?」という問いかけに対してほぼ全員がYesでした。しかし、数年後同じ質問をすると半数ぐらいしかYesとなりませんでした。
 風太郎は日本の成功理由の一つが、品質をあげながらコストを下げるといったことに成功したからだと考えています。

品質を向上させるとコストが下がるわけ

 品質が悪いと次のような明示的なコストがあります。

  • 品質不適合(規格外)による製造品の廃却(製造コスト+廃却コスト)
  • 出荷量を確保するための割増作業(含む追送コスト)
  • 検査頻度をあげるなどの人件費上昇、稼働率トヨタ生産方式では可動率)低下

です。 そのほかに出荷後の初期故障やお客様の満足度低下などが発生します。
 そのため、普段の品質管理を行うほかに、新技術があれば導入して、品質向上を含めた生産性向上を行っていこうとします。

唐揚げを事例とした問題解決による品質向上とコストダウン

 ここでは多くの人が大好きな唐揚げを題材として問題解決の事例を論じてみます。
 また、新技術として「IH調理器」を導入したが、うまく活用できなかった。という製造業あるあるの対策も行っています。

問題

 大好きな唐揚げを作ります。その時の問題としては、副次的な問題を含めて次の通りです。

  • 中まで火が通らない
  • 逆に火が通り過ぎてまずい
  • 外側が固すぎる(ほぼ捨てるレベル)
  • 外に油が跳ねる

 という状況です。会社ならば売り物にならないものをもったいなくて食べているという感じです。もしこれを捨てたとしたらどうなるでしょうか?製造での仕事を考えて一般的な言葉も織り交ぜながら述べてみます。

  • コストアップまたは食べる量が減る
  • 追加材料を購入する場合、その量が見込めない(捨てる量が見込めないから)
  • 残ったやつも美味しくない  といった状況です。

これに対して今までにとった対策は次の通りです。

  • 肉を常温に戻した(室温放置)
  • 2度揚げを行った(手動温調とIHの揚げ物温度調整を活用)

しかしながら、次のような問題点がありました

  • IHの揚げ物温度調整ではエラーが出てしまうことが多く使いにくい
  • エラーが出なくても、設定温度までに時間がかかる
  • 手動温調ではうまく温度コントロールができない

現状把握

対策のために現状をよく把握します。
唐揚げのステップを見ると 肉を切る>唐揚げ粉をまぶす(or漬ける)>室温戻し>1度目揚げる>2度目揚げる  という大変シンプルな工程です。 ここで難しいなと感じたのは

  • 肉を切る→同じ大きさに切るのは難しい
  • 揚げる時の温度コントロール

 の二つです。最初の同じ大きさの切るというは個人の家では難しいです。お店だと細かい肉は他に使い道がありますが、家庭ではありません。そもそも包丁さばきも下手です。本来はそれでも上手に揚げるための2度揚げです。それがうまく行っていません。
 IHのエラーでうまく行かないことが一番のネックだと考えました。

目標設定

 揚げ物のIH温度のコントロールがうまくいくようにする。

要因の解析

 まずIHの原理をよく考えます。温度はおそらくセンサーがIH面に仕込まれているのでしょう。それを元にIHの電力を制御しているものと思われます。その制御がうまく行かないときにエラーが出るのでしょう。

対策立案

 使っているのは、アルミにステンレスを打ち込んだフライパンです。よく観察すると底面が反っています。そこで、平らで密着する鍋を使いました。具体的には一番下に書いてあるホーロー鍋です。
 これなら平面のため、センサーや各種制御がうまくいくのではないか?と仮説を立てました。 また、蓋付きのため、温度も早くあがると推定しました。

結果

 エラーが発生せず、設定温度まで上がりました。確認は設定温度まであがったというIHレンジの結果です。 また体感的に早く温度上昇したと感じました。

効果

 揚げたところ1回目は綺麗な肌色(?)になり、2回目は見事な小麦色に揚げ上がりました。
 また副次的な効果として油の飛び跳ねがなくなり、台所周りが綺麗になりました。

結果について

 これでなんとか唐揚げがうまくできるようになりました。長くなったので、これについての考察は別に記事をアップしあます。