今回は三好大悟著のビジネスの現場で使えるAI&データサイエンスの全知識(できるビジネス)です
本書では今話題のデータサイエンスについて実際にエクセルデータを使いながら学べます。今は情報社会でデータで溢れかえっていますので、それらを扱って何をするかが求められています。例えるなら膨大なデータから統計解析をしていくようなイメージです。今は本業×○○というスキルの組合せが求められていますので、本書でデータサイエンスを学んでみませんか
関連する記事はこちらからどうぞ。今回もなるほどポイントを3つ紹介していきます。
なるほどポイント
- 平均値と中央値の違い
- 身近で使われているレコメンデーションその影響力とは
- 実際にサンプルを触ってみて
ビジネスの現場で使えるAI&データサイエンスの全知識(できるビジネス) [ 三好大悟 ] 価格:1,980円 |
平均値と中央値の違い
平均値というのは身近ですが極端な数値が出ている場合、正しく評価できない場合があります。そういった場合向けに中央値が設けられています。
- 平均値:すべての数値を足して、個数で割ったもの
- 中央値:数値を小さい順に並べて、真ん中に来るもの
あくまでも目安なので片方を使うのでなく、違う目線で考えると別の見え方が出来るという事なんです。これ以外にも最頻値という指標もありますので、データを扱う方は参考にしてみてください
AIと聞いて万能なイメージ湧く人いませんか?私みたいに。ただAIのディープラーニングってそこまで万能じゃないんです。原理を知るとそういうことか…といった印象です。簡単に言うと画像を数値化してライオンの写真の数値と他のライオンの数値が酷似していると近しいとなるわけです。数値化には顔の凹凸などでなされるようです。画像診断などには応用できそうですね
身近で使われているレコメンデーションその影響力とは
レコメンデーションだと聞き慣れないのでオススメと称しますね。Amazonだと35%、Netflixだと75%で影響されるそうです。視聴履歴や購買履歴からオススメされる機能でこれもデータサイエンスなんです。youtubeでもその人のオススメを観ると最近の興味がわかると言われていますしね
統計的に原理はわかると思いますが、プログラミングを組むのはまた別のスキルになります。エンジニアの方もデータサイエンスの知識があれば差別化になるのでは?
ちなみにアンケートを外注するといくらくらいかかると思いますか?今はもっと安いと思いますが、昔は結構高かったです。10年前にアンケートを外注したら30万円くらいかかりました。そこそこ有名な企業なので名前は伏せますが、それくらいかかるもんなんです。私は研究室の経費でやったのでそんなかかるんだーという印象でした
実際にサンプルを触ってみて
本書にはエクセルのダウンロードファイルもありまして、実際にデータサイエンスに触れることが出来ます。ただ触ってみて思いましたが、下処理が9割だなと思いました。つまりデータを解析しやすいように属性ごとに並び替えたりする必要があるんです。2桁くらいのデータなら自分でエクセルに打ち込めば良いですが、4桁とかになるとそうはいきません。生データをエクセルにコピペしますが、しっかり出来ないと結果がおかしくなります
実際にデータを触ってみると数字の羅列から様々な解釈ができました。これを現場に活用出来たらかっこいいんだろうなと思いました。私も大学時代に統計を少しかじったのでt検定などの初歩的な解析には知恵があります。そんな私でも思うのは統計に対して皆知らなさすぎということです。なのでデータサイエンス分野ではブルーオーシャンなんじゃないかなと思います
これは私の経験からなのですが、こういった分析ってなんとなく触っていても上達しないんです。目的というか「高血圧患者でこの薬を使っている患者の年齢別の副作用発現率を調査する」のように具体的に考えなければいけません。なんとなくデータサイエンスやってみよう!でも良いですが、しっかり目的を明確にするようにしましょう。それでは。
ビジネスの現場で使えるAI&データサイエンスの全知識(できるビジネス) [ 三好大悟 ] 価格:1,980円 |
価格:2,099円 |