T5①(論文のAbstractの確認)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #26

f:id:lib-arts:20191125191712p:plain

言語処理へのDeepLearningの導入をご紹介するにあたって、#3〜#8においては、Transformer[2017]やBERT[2018]について、#9~#10ではXLNet[2019]について、#11~#12ではTransformer-XL[2019]について、#13~#17ではRoBERTa[2019]について、#18~#20ではWord2Vec[2013]について、#21~#24ではALBERT[2019]について取り扱ってきました。

XLNet②(事前学習におけるAutoRegressiveとPermutation)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #10 - lib-arts’s diary

Transformer-XL(論文のAbstractの確認)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #12 - lib-arts’s diary

RoBERTa(論文の詳細④ RoBERTa、Related Work、Conclusion)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #17 - lib-arts’s diary

Word2Vec②(Model Architectures&New Log-linear Models)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #19 - lib-arts’s diary

ALBERT③(The Elements of ALBERT)|言語処理へのDeepLearningの導入の研究トレンドを俯瞰する #23 - lib-arts’s diary

#26以降では事前学習モデルにおいてSotAを達成した2019年10月のT5(Text-to-Text Transformer)について確認するにあたり、"Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"について取り扱って行きます。

[1910.10683] Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer

#26ではAbstractを確認し、論文の概要を掴んでいきます。
以下目次になります。
1. Abstractと論文の概要
2. まとめ

 

1. Abstractと論文の概要
以下Abstractの和訳と簡単な補足を行なっていきます。

Transfer learning, where a model is first pre-trained on a data-rich task before being fine-tuned on a downstream task, has emerged as a powerful technique in natural language processing (NLP).

和訳:『まず最初に豊富なデータのあるタスクモデルの事前学習を行い、downstream taskでfine-tuneを行う転移学習(transfer learning)は言語処理の分野でとても強力な技術として提唱されてきている。』
基本直訳ベースですが、少々日本語的にわかりやすい語順に直すにあたり訳は改変しました。BERT[2018]やXLNet[2019]などに代表される、言語処理における事前学習(pre-training)と転移学習(transfer learning)について記されています。大まかな考え方としては、Wikipediaのような大きなデータで事前学習を行い、正解ラベルを付与したタスクで転移学習をすることで、比較的小さなデータセットでも学習ができるようにというのが大まかな流れです。

The effectiveness of transfer learning has given rise to a diversity of approaches, methodology, and practice.

和訳:『転移学習の効果によって、多様なアプローチ、手法、実践がなされるようになってきている。』
転移学習時のベンチマークであるGLUE(General Language Understanding Evaluation)のスコアの更新一つとっても、BERT、XLNet、RoBERTa、ALBERT、T5などに挙げられるように2018年10月に発表されたBERT以来、一年ほどで様々な研究がなされてきています。これらは単なるSotAの更新もそうですが、それぞれフォーカスポイントが違っており、多様な研究がなされているというのが納得できるのではと思われます。また、SotAの更新以外にも研究はなされており、その辺を反映してdiversityという言葉が用いられていると思われます。

In this paper, we explore the landscape of transfer learning techniques for NLP by introducing a unified framework that converts every language problem into a text-to-text format.

和訳:『この論文において、我々は全ての言語処理の問題をtext-to-textのフォーマットに変換する統一的なフレームワークを導入することで、言語処理における転移学習の景観(landscape)を探索する。』
T5は"Text-to-Text Transfer Transformer"の略で、言語処理の問題設定や実装のフォーマットとして統一な規格を導入するとされています。

f:id:lib-arts:20191125191712p:plain

フォーマットとしては、上図のようにすることで多様な問題を一つのフォーマットに落とすことができるとされています。

Our systematic study compares pre-training objectives, architectures, unlabeled datasets, transfer approaches, and other factors on dozens of language understanding tasks.

和訳:『我々の体系的な研究は事前学習の目的関数(pre-training objectives)、ネットワーク構造(architectures)、ラベル付けされていないデータセット、転移学習のアプローチ、そして多くの言語理解タスクにおけるその他の懸案事項(factor)の比較を行なっている。』
様々なアプローチの統合がT5におけるテーマであり、text-to-textの形で統一的にアプローチをまとめています。

By combining the insights from our exploration with scale and our new "Colossal Clean Crawled Corpus", we achieve state-of-the-art results on many benchmarks covering summarization, question answering, text classification, and more.

和訳:『"Colossal Clean Crawled Corpus"などのデータセットの探求からの洞察を加えることで、我々は文書要約、質問応答、テキスト分類などを含む多くのベンチマークにおいてSotAを獲得した。』
若干文意が取れないところは意訳にしましたが、概ね間違っていないとは思われます。新しく導入されたデータセットの"Colossal Clean Crawled Corpus"は大体750GBのテキストで、16GBほどのWikipediaよりも大きなデータとなっています。T5のフォーカスは精度よりもtext-to-textの構造にありながらSotAを出すに至った背景としては、この辺のデータセットの充実もあるのではと考えられます。

To facilitate future work on transfer learning for NLP, we release our dataset, pre-trained models, and code.

和訳:『言語処理における転移学習の将来研究を容易にするために、我々はデータセット、事前学習モデル、及びコードをリリースした。』
近年の他の研究と同様に、データセットや事前学習モデル、コードが公開されているとのことです。


2. まとめ
#26ではT5(Text-to-Text Transformer)についての論文である、"Exploring the Limits of Transfer Learning with a Unified Text-to-Text Transformer"のAbstractを確認し、論文の概要を掴みました。
#27では引き続き論文の内容を確認していきます。

Ch_5 競争戦略から企業戦略へ(前編)|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #9

f:id:lib-arts:20191028154807p:plain

「[新版]競争戦略論Ⅰ」を読み進めていきます。

[新版]競争戦略論Ⅰ | 書籍 | ダイヤモンド社

過去の読解メモについては下記などを参照ください。

Ch_5 トレードオフ ー 戦略のかすがい|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #8 - lib-arts’s diary

Ch_6 適合性 ー 戦略の増幅装置|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #9 - lib-arts’s diary

#8では第4章の『戦略とインターネット』の後編として、「インターネット競争の未来」以降の内容を取り扱いました。

Ch_4 戦略とインターネット(後編)|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #8 - lib-arts’s diary

#9では第5章の『競争戦略から企業戦略へ』の前編として、「企業戦略が満たすべき三つの基準」までの内容を取り扱います。
以下目次になります。
1. 見失われている企業戦略の本質
2. 企業戦略の現実を直視する
3. 企業戦略を成功させるための前提条件
4. 企業戦略が満たすべき三つの基準
5. 感想・まとめ


1. 見失われている企業戦略の本質(簡単な要約)
企業戦略、すなわち多角化した企業のための全社計画がもてはやされているが、関心の高まりに見合うだけの扱いを受けていない。うまくいっていない理由としては、企業戦略とは何かということについても、それをどのように策定するかについても、共通認識が全く存在していないということにある。
多角化したコングロマリット企業の戦略には二つのレベルがあり、「事業戦略(競争戦略)」と「企業戦略(全社戦略)」である。事業戦略はその企業が参入している各事業分野においていかに競争優位性を生み出していくかをテーマとしている。一方、企業戦略では二つのことなるテーマがあり、どの事業分野に参入するかという問題と、様々な事業単位をいかにコントロールするかという問題である。
企業戦略があるからこそ、企業は事業単位という部分の総和以上の存在になることができるが、企業戦略の歴史を振り返ってみると失敗例も多い。企業戦略を再考することが現代では求められており、企業を買収して分割する乗っ取り屋は、間違った企業戦略のおかげで暴利を貪っている。
結局、生き残るためには優れた企業戦略とは何かを理解する必要がある。


2. 企業戦略の現実を直視する(簡単な要約)
企業戦略の成否に関心が寄せられているが、何をもって企業戦略が成功したと言えるのか、あるいは失敗したとみなすべきなのかに対して満足できる判断材料は少ない。
多くの研究は合併が発表された直前と直後の株化の推移を比べることで、株式市場が合併をどのように評価したかを調べ合併の良し悪しの判断としようとしているが、あまりうまくいっていない。
企業戦略が成功したか失敗したかを判断するには長期的な視点で多角化戦略を研究する方がはるかに説得力に富む結論を得られると思われる。

 

3. 企業戦略を成功させるための前提条件(簡単な要約)
企業戦略が成功するためにはいくつかの前提条件が必要であり、それらの条件は多角化の現実を端的に表すもので、変えることができない前提である。下記に三つの前提をまとめるが、企業戦略が失敗した場合、原因の一部はこの前提を無視したことにある。

1) 競争は事業単位で行われる
-> 競争するのは多角化した企業単位ではなく、その部分である各事業単位である。企業戦略は各事業の成功を後押ししなければならず、企業戦略とは競争から生じ、競争戦略を強化するものでなければならない。

2) 多角化はコストを押し上げ、事業単位への制約を強める
-> 事業単位に割り当てられる間接費といった目に見えるコストよりも、隠れたコストや制約条件の方が重要な問題である。経営陣への説明や、社内システムとの整合性、親会社のガイドラインなどのコストや制約条件は軽減することはできるがなくすことはできない。

3) 株主はポートフォリオを簡単に多角化できる
-> 株主はその嗜好やリスクの種類に応じて最もふさわしい銘柄を選ぶことで株式ポートフォリオ多角化することができる。

以上を踏まえると、企業戦略が成功するには、真の意味で「価値を付加する」ものでなければならない。すなわち、事業単位には独立性への制約という内部コストを相殺するような具体的なメリットを生じさせ、株主にはポートフォリオ多角化では実現できないような投資の多角化を実現させることが必要である。

 

4. 企業戦略が満たすべき三つの基準(簡単な要約)
企業戦略を策定する方法を理解するには、まずどのような条件が揃えばその多角化が真に株主価値を創造したと言えるのかを明確にする必要がある。その条件とは下記の三つの判定基準に集約される。

1) 魅力度基準
-> 新規参入する業界は魅力的かあるいはその可能性がなければならない。

2) 参入コスト基準
-> 参入コストが将来の利益を相殺するほど高くてはいけない。

3) 補強関係基準
-> 新しい事業単位は他の既存事業と結びつくことで、あるいは自立することで、競争優位を獲得するものでなければならない。

ほとんどの企業がこれら三つの基準の一部を満たした企業戦略を策定していると思われるが、この三つの基準をどれか一つでも無視するとその企業戦略は残念な結果に終わる。


5. 感想・まとめ
#9では第5章の『競争戦略から企業戦略へ』の前編として、「企業戦略が満たすべき三つの基準」までの内容についてまとめました。ドラッカーのマネジメントでは、企業と事業の違いがあまりわかりやすく書かれていなかったので、明確に分けて議論してあり非常にわかりやすく参考になる内容でした。
#10では第5章の『競争戦略から企業戦略へ』の後編として、「企業戦略の四つのコンセプト」以降について確認していきます。

合成関数の微分と最大値問題|高校数学の演習を通して理解する確率分布と最尤法 #3

f:id:lib-arts:20191112170245p:plain

以前のシリーズで機械学習アルゴリズムであるニューラルネットワークやランダムフォレストに絡めて高校レベルの数学の様々なトピックについて取り扱いました。

上記ではニューラルネットワークやランダムフォレストを中心に取り扱いましたが、今回は確率分布と最尤法について取り扱っていきます。
#1では集合・確率と様々な関数(指数関数、対数関数)について、#2では確率分布のグラフ化と掛け算と対数について取り扱いました。

集合・確率&様々な関数(指数関数、対数関数)|高校数学の演習を通して理解する確率分布と最尤法 #1 - lib-arts’s diary

確率分布のグラフ化&掛け算と対数|高校数学の演習を通して理解する確率分布と最尤法 #2 - lib-arts’s diary

#3では合成関数の微分と最大値問題について取り扱います。
以下、目次になります。
1. 例題⑤ 合成関数の微分
2. 例題⑥ 最大値問題
3. まとめ

 

1. 例題⑤ 合成関数の微分
1節では合成関数の微分について取り扱っていきます。複雑な関数の微分を行っていくにあたっては合成関数の微分については避けては通れませんが、基本的に演算に慣れればできるようになりますのでこちらについても手を動かして慣れるようにしていただけたらと思います。
\frac{dy}{dx}=\frac{dy}{du} \frac{du}{dx}
基本的には上記に基づいて微分を行っていきます。

ex.05
下記の関数を微分せよ(下記の関数の導関数を求めよ)。
1) f(x)=exp(x)
2) f(x)=\ln x
3) f(x)=exp(x^2)
4) f(x)=exp(-x^2)
5) f(x)=\ln x^3

Answer.
1)
f'(x)=exp(x)
2)
f'(x)=\frac{1}{x}
3)
u=x^2とおく
f'(x)=\frac{d f(x)}{du} \frac{du}{dx} = 2x exp(x^2)
4)
u=-x^2とおく
f'(x)=\frac{d f(x)}{du} \frac{du}{dx} = -2x exp(-x^2)
5)
f(x)=\ln x^3=3\ln xに変換できる。
f'(x)=\frac{3}{x}

解説.
1)と2)はそれぞれ指数関数と対数関数の微分の公式に基づいています。3)と4)は指数関数における合成関数の微分を扱うにあたって、x^2をベースに合成関数を作成しています。5)も合成関数ですが、対数は掛け算を和の形に分解ができるため、先に書き換えてから公式をそのままあてはめることができます。
ここからも、最小値・最大値問題を解くにあたって、関数が掛け算で表されている傾向にある時は対数を用いると便利だということがわかります。

 

2. 例題⑥ 最大値問題
2節では最大値問題について取り扱います。ニューラルネットワークの際は誤差関数の最小化ということで最小値問題としましたが、今回は尤度(対数尤度)の最大化を取り扱うため、最大値問題を取り扱います。また、誤差関数の最小化も尤度の最大化から導くことができるのですが、少々発展的な話題のため、別の記事で取り扱います。

ex.06
下記の関数L(\theta)を最大にする\thetaを求めよ。
1) L(\theta)=\theta^{600} (1-\theta)^{400}
2) L(\theta)=\Pi_{i=1}^N \frac{\theta^{k_{i}} exp(-theta)}{k_{i}!}
3) L(\theta)=\Pi_{i=1}^N \frac{1}{\sqrt{2 \pi}}exp(-\frac{(x_{i}-\theta)^2}{2})

Answer.
\ln L(\theta)を最大にする\thetaL(\theta)も最大にするので、それぞれ\ln L(\theta)を求めた上で計算していく。
1)
\ln L(\theta)=600\ln(\theta) + 400\ln(1-\theta)
\frac{\delta \ln L(\theta)}{\delta \theta}=\frac{600}{\theta}-\frac{400}{1-\theta}
\frac{\delta \ln L(\theta)}{\delta \theta}=0を解いて、\theta=0.6を得る。
2)
\ln L(\theta)=\sum_{i=1}^N (k_{i}\ln(\theta) - \theta - \ln(k_{i}!))
\frac{\delta \ln L(\theta)}{\delta \theta} = \sum_{i=1}^N (\frac{k_{i}}{\theta} - 1)
\frac{\delta \ln L(\theta)}{\delta \theta}=0より\theta=\frac{\sum_{i=1}^N k_{i}}{N}を求めることができる。
3)
\ln L(\theta)=\sum_{i=1}^N (\ln(\frac{1}{\sqrt{2 \pi}}) - \frac{(x_{i}-\theta)^2}{2})
\frac{\delta \ln L(\theta)}{\delta \theta} = \sum_{i=1}^N -2\frac{(x_{i}-\theta)}{2}=-\sum_{i=1}^N (x_{i}-\theta)
\frac{\delta \ln L(\theta)}{\delta \theta}=0より、\theta=\frac{\sum_{i=1}^N x_{i}}{N}を導出できる。


3. まとめ
#3では合成関数の微分と最大値問題について取り扱いました。
#4ではここまで取り扱ってきた例題の内容を確率分布や最尤法の文脈で再度確認していきます。

Ch_4 戦略とインターネット(後編)|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #8

f:id:lib-arts:20191028154807p:plain

「[新版]競争戦略論Ⅰ」を読み進めていきます。

[新版]競争戦略論Ⅰ | 書籍 | ダイヤモンド社

過去の読解メモについては下記などを参照ください。

Ch_5 トレードオフ ー 戦略のかすがい|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #8 - lib-arts’s diary

Ch_6 適合性 ー 戦略の増幅装置|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #9 - lib-arts’s diary

#7では第4章の『戦略とインターネット』の前編として、「インターネットの神話」までの内容を取り扱いました。

Ch_4 戦略とインターネット(前編)|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #7 - lib-arts’s diary

#8では第4章の『戦略とインターネット』の後編として、「インターネット競争の未来」以降の内容を取り扱います(2001年時の論述を元にしているようなので、時代背景を踏まえた上で解釈が必要と思われます)。
以下目次になります。
1. インターネット競争の未来
2. インターネットと競争優位
3. 戦略の不在
4. 補完としてのインターネット
5. ニューエコノミーの終焉
6. 感想・まとめ

 

1. インターネット競争の未来(簡単な要約)
今後、インターネット技術によって各業界がどのように変わっていくかは業界によって異なる。しかし、業界構造に影響を及ぼす競争要因について検証していくと、インターネット技術の導入によって多くの業界で収益性が圧迫されることが見えてくる。
新規起業と既存企業の戦いに、低い参入障壁が加わることで、多くの業界では企業の数が増え、それゆえにインターネットが登場する以前より競争が激しくなるという傾向が見られる。顧客がインターネットに慣れてくれば顧客はスイッチングコストが低いことに気づき、サプライヤーへのロイヤリティも次第に薄れてくる。
インターネットが業界構造に与える影響を考える際には長期的な影響を検討することが重要である。最終的には参入障壁を築けるかどうかが決定的に重要である。

 

2. インターネットと競争優位(簡単な要約)
インターネットが原因で多くの業界で平均収益性が低下していくならば、平均的な企業より高い利益を実現するために、各社とも横並びを回避することが重要である。その唯一の方法が、持続可能な競争優位を確立することであり、そのためにはコストをさらに低下させるかプレミアム価格を設定するか、あるいはその両方が要求される。
コスト優位もしくは価格優位には二つの方法があり、一つが「業務効果」の向上であり、もう一つが「戦略的ポジショニング」である。インターネットは業務効果と戦略ポジショニングそれぞれに異なる形で影響を及ぼす。業務面で優位性を維持するのは難しいが、インターネットによって新たなチャンスが生まれたり、独自の戦略ポジショニングが強化されたりする。

・業務効果
業務効果を向上させるツールの中でインターネットは間違いなく最強である。インターネットによってリアルタイムの情報をより簡単、よりスピーディに交換できるようになり、その結果ほぼ全ての起業と業界を横断する形でバリューチェーン全体が改善された。
しかし業務効果を改善しただけでは競争優位は得られず、優位性を獲得するには競合他社よりも高い水準の業務効果を実現・維持しなければならない。インターネットアプリケーションはその性質ゆえに業務面で優位性を維持することをこれまで以上に難しくする。

・戦略ポジショニング
業務効果の面で優位性を維持するのが難しいとなると、戦略的ポジショニングがますます重要になる。ライバル以上の業務効果を得られない場合、高水準の経済的価値を生み出すには独自の方法によって競争することでコスト優位かプレミアム価格を実現するしかない。
戦略の実行にあたっては成長だけでなく収益性に、また独自のバリュープロポジション(提供価値)を定義する能力に、そして「何をすべきでないのか」に関するトレードオフの選択に焦点を絞らなければならない。
戦略はベストプラクティスの追求とは全く異なる。戦略には独自のバリューチェーン(製品やサービスの生産と提供に必要な一連の活動)を構築することも含まれる。
さらに、バリューチェーンは高次元に統合されていなければならない。ライバルが戦略を模倣しようとしても、自己強化的なシステムとして各活動が相互に適合していれば製品の特徴を一つか二つ、もしくはある活動のやり方を真似るだけではおよそ十分でなく、システム全体を再現しなければならないので模倣は困難になる。


3. 戦略の不在(簡単な要約)
インターネットの導入にあたって多くの企業はトレードオフを軽視して思い付く限りの製品やサービスを提供することだけに集中してしまった。この際に多くの企業が戦略をないがしろにしたせいで業界構造はおかしくなり、競争は収斂に向かい、どの企業も競争優位を獲得することが難しくなった。結果として破滅を招くようなゼロサム競争が始まり、顧客の獲得と収益力の向上が混同されるようになった。
独自の戦略に注力し、独自の活動を整え、その適合性を高めることにおいて、インターネットは全世代のITよりも優れた技術プラットフォームを提供する。インターネットアーキテクチャーができたところでITは以前に比べて戦略にとって強力なツールになった。
バリューチェーン全体を網羅したITプラットフォームを導入すればインターネットアーキテクチャーとその規格をてこにして、一元化とカスタマイズの両方を施したシステムが構築され、活動間の適合性が一層強化される。
このような優位性を獲得するには箱を開けてそのまま使える、ありきたりのパッケージソフトを利用するのをやめ、その代わり自社独自の戦略に合わせてインタネット技術を導入・調整する必要がある。これこそ競争優位の持続可能性をもたらすものである。

4. 補完としてのインターネット(簡単な要約)
インターネットは既存事業とカニバリゼーションを起こしやすく、これまで積み上げてきた優位性を全て覆してしまうなどと言われているが、これは誇張された話である。インターネット技術は既存チャネルとカニバリゼーションを起こすことはなく、むしろ既存チャネルにこれまで以上のチャンスをもたらす可能性がある。
実際、インターネットを利用する活動は、顧客への情報発信、取引の処理、投入資源の調達など、競争に決定的な影響を及ぼす類のものではない。また、優秀な人材、独自の製品技術、効率的なロジスティックシステムなど、企業にとっての重要な資源も変わらない。
インターネットは従来の活動や競争のやり方と衝突するのではなく、むしろ補完するケースが多い。インターネットがもたらすチャンスの規模を現実的に評価するには、ネット事業を展開している業界と同じような特徴が見られる業界を調べてみると良い。インターネットを利用した活動とこれまでの活動の間に相互補完性が生まれる理由はいくつかあり、下記にまとめる。

1) ある活動にインターネットアプリケーションを導入すると、バリューチェーン内の様々な物理的活動を調整する理由が生じる。
2) ある活動でインターネットを利用すると、活動システム内の因果関係ゆえに、新たな活動や活動の改善が必要になる。
3) 従来の手法と比較すると、インターネットアプリケーションの大半がなんらかの限界を抱えている。

実際インターネットの利用と従来の手法は互恵関係にあることが多い。インターネットについて、カニバリゼーションを起こす存在と考えるのではなく、補完するものと考えられるようになれば全く異なる方法でオンライン事業を提供できるようになる。既存事業から隔離するよりも主力部門全てがその責任を負うべきであり、インターネットを成功裏に導入するという意欲が組織メンバー全員に欠かせない。


5. ニューエコノミーの終焉(簡単な要約)
インターネットは既存の業界や企業を破壊するものではなく、業界において最も重要な競争優位の源泉を台無しにすることもまずない。むしろ多くの場合、競争優位の源泉をより強化する。
あらゆる企業がインターネット技術を使うようになればインターネット自体が競争優位の源泉ではなくなり、ゲームの「掛け金」のようなゲームを続けるには必須だが、持っているだけでは何も得られないものになる。
揺るぎない競争優位は、従来からの強み(自社ならではの製品、独自性の高いコンテンツ etc)などから生まれてくる。インターネット技術は、各活動を独自の活動システムにまとめ上げることで、これらの優位性を強化するが、取って代わることはない。最終的には多くの業界において、インターネット、従来からの競争優位、競争のやり方の三つを統合する戦略が主流となるべきである。
我々は「インターネットはどのように違うのか」ばかりを考えてきたが、そのせいで「インターネットはどのくらい同じなのか」という点を見落としてきた。新しいやり方で事業を運営できるようになったとはいえ、競争の基本条件はなんら変わらない。インターネットを全体の戦略に統合することによってのみ、この新しい強力なツールは競争優位を生み出す強力な力に変わる。


6. 感想・まとめ
#8では第4章の『戦略とインターネット』の後編として、「インターネット競争の未来」以降についてまとめました。道具を使いこなせるように組織全体を変化させていくことは重要だが、道具そのものが強みにはならないということを言っており、非常に良い考察だと思われます。実際現代ではインターネットがあたり前のように普及したことで、書かれてある通りになっているように思われます。
#9では第5章の『競争戦略から企業戦略へ』について確認していきます。

CRISP-DMの簡単な概要|CRISP-DMを改めて考える #1

f:id:lib-arts:20191115190651p:plain

データサイエンスや機械学習についての話題をよく目にする今日この頃ですが、同時にマネジメントが迷走するケースなども時折見かけます。
上記を受けて当連載では1990年代後半頃に考案されたCRISP-DM(CRoss Industry Standard Process for Data Mining)というマネジメント技法について見ていくことで、マネジメントにおける注意すべきポイントなどを見ていければと思います。(CRISP-DMはデータマイニングにおけるマネジメント技法とされていますが、データサイエンスとデータマイニングはそこまで区別しなくても良いかと思われるので、当連載においては同様に取り扱うものとします)
#1ではWikipediaなどを元にCRISP-DMの概要を見ていきたいと思います。
以下、目次になります。
1. CRISP-DMの概要
2. 参考資料の確認
3. まとめ


1. CRISP-DMの概要
1節ではCRISP-DM(CRoss Industry Standard Process for Data Mining)の概要について取り扱います。ここではWikipediaの内容を確認していきます。

f:id:lib-arts:20191115190827p:plain

Cross-industry standard process for data mining - Wikipedia

上記が概要になっています。まず、CRISP-DMは"Cross Industry Standard Process for Data Mining"の略で、業界の枠組みを超えたデータマイニングの標準プロセスであるということを示唆しています。CRISP-DMはデータマイニングのexperts達によって用いられる一般的なアプローチであるとされており、広く用いられている分析の手法であるとされています。同様の文脈でIBMがASUM-DM(Analytics Solutions Unified Method for Data Mining)を2015年にリリースしており、これはCRISP-DMを拡張したものだとされています。

f:id:lib-arts:20191115191506p:plain

次にCRISP-DMの歴史について簡単に見ておきます。上記のように、CRISP-DMは1996年に考案されたとされており、様々なアップデートなどが加えられてきているようです。

f:id:lib-arts:20191115191906p:plain

上記はCRISP-DMの大枠の考え方について示しています。各ステップとしては、ビジネスの理解(Busuness Understanding)、データの理解(Data Understanding)、データの準備(Data Preparation)、モデリング(Modeling)、評価(Evaluation)、デプロイ(Deployment)から成り立っているとされています。それぞれのフェーズは厳密に定められておらず、必要に応じて進んだり戻ったりするとされています。また、フェーズ間の矢印は最も顕著な依存関係を指し示しており、外側のサークルの流れはデータマイニングそのものの流れを意味しています。ここで注意したいのが、データマイニングのプロセスはデプロイ後も続くということです。

ここまででCRISP-DMの大枠についてつかむことができました。データの準備やモデリングだけではなく、分析が必要とされるビジネス的な背景を踏まえて課題を考え、評価を行うことで、意味のある分析を行っていくことができると思われます。


2. 参考資料の確認
2節では参考資料の確認を行います。

f:id:lib-arts:20191115194450p:plain

Wikipediaの記事の下の方にReferencesが載っています。より詳しく見る際にはこちらなどを参考にしていくと良さそうです。


3. まとめ
#1ではWikipediaの内容を元に簡単な概要を掴みました。
#2では今回の2節で取り扱った参考資料などを元に、詳しく確認していければと思います。

Ch_4 戦略とインターネット(前編)|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #7

f:id:lib-arts:20191028154807p:plain

「[新版]競争戦略論Ⅰ」を読み進めていきます。

[新版]競争戦略論Ⅰ | 書籍 | ダイヤモンド社

過去の読解メモについては下記などを参照ください。

Ch_5 トレードオフ ー 戦略のかすがい|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #8 - lib-arts’s diary

Ch_6 適合性 ー 戦略の増幅装置|『[エッセンシャル版]マイケル・ポーターの競争戦略』読解メモ #9 - lib-arts’s diary

#6では第3章の『情報技術がもたらす競争優位』を取り扱いました。

Ch_3 情報技術がもたらす競争優位|『[新版]競争戦略論Ⅰ(by Michael Porter)』読解メモ #6 - lib-arts’s diary

#7では第4章の『戦略とインターネット』の前編として、「インターネットの神話」までの内容を取り扱います(2001年時の論述を元にしているようなので、時代背景を踏まえた上で解釈が必要と思われます)。
以下目次になります。
1. インターネットは何を変えたのか
2. ゆがめられる市場シグナル
3. 戦略の原点に回帰する
4. インターネットと業界構造
5. インターネットの神話
6. 感想・まとめ


1. インターネットは何を変えたのか(簡単な要約)
インターネットは極めて重要な技術であり、起業家、経営者、投資家、ビジネスジャーナリストの注目を集めている。注目度合いが大きいので「インターネットによってこれまでの企業や競争に関する既存のルールは全て時代遅れとなり、何もかもが変わってしまう」と考えがちだが、この反応は危険であるので注意しなければならない。
インターネットについて、今こそはっきりした見解を打ち出すタイミングである。そのためには「ネット業界」、「eビジネス」、「ニューエコノミー」と行った流行り言葉は聞き流し、インターネットのありのままの姿を見つめる必要がある。これにあたり、下記のような根本的な問題について考えると良い。

・インターネットが生み出す経済的恩恵を誰が手にするのか
・業界構造にはどのような影響が及ぶのか
・業界のプロフィットツールは増えるのか減るのか
・戦略にはどのような影響が及ぶのか
・持続的な競争優位を獲得する能力を高めるのかそれとも低下させるのか

考えるにあたって重要になるのは、インターネットを利用すべきかどうかではなく(競争力の維持を望むなら選択の余地はない)、どのように利用すべきかという問いである。
インターネット技術は全世代のIT以上に独自の戦略ポジショニングを構築するチャンスを企業にもたらす。そしてそのような競争優位を獲得するのに過激な手法は不要であり、基本原則に従うだけで良い。成功を手にするのは従来業務と切り離してインターネットプロジェクトを立ち上げる企業ではなく、これまでの競争のやり方を補完するためにインターネットを活用する企業である。
インターネットは誰かが論じているように戦略の重要性を失わせるのではなく、むしろこれまで以上に高めるものである。


2. ゆがめられる市場シグナル(簡単な要約)
こちらについては省略します。


3. 戦略の原点に回帰する(簡単な要約)
インターネットの活用を通した経済的価値の創造を考えるにあたっては、市場から発せられているシグナルではなく、収益性を左右する次の二つの基本要因について検討すると良い。

・業界構造(業界構造によって業界内の平均的企業の収益性が決まる)
・持続的な競争優位(競争優位を確立できれば平均的企業の上を行くことができる)

これら二つの基本ドライバーが収益性を左右するのは普遍的な事実で、どんな技術が使われていようと、どんな事業であっても原則は変わらない。しかし同時に上記の表れ方が業界や企業によって大きな違いがあることに注意が必要である。


4. インターネットと業界構造(簡単な要約)
インターネットはオンラインオークションやeマーケットプレースなど新たな業界を生み出したが、インターネットの最大のインパクトは、これまでコミュニケーションや情報の収集、取引の処理などのコストが高く、制約を受けてきた既存業界に改革をもたらしたことである。
業界の新旧を問わず、業界の構造上の魅力度は「五つの競争要因(five force)」、すなわち「既存企業同士の競争」、「新規参入者の脅威」、「サプライヤーの交渉力」、「代替品や代替サービスの脅威」、「買い手の交渉力」によって決まる。
製品やサービス、技術や競争のやり方によって創造された経済的価値が、一方では業界の既存企業間において、他方では買い手、売り手、流通業者、代替品、新規参入者の間においてどのように分配されるのかを左右するのもこれら五つの競争要因である。
これら五つの競争要因の影響力は業界によってかなり異なるため、インターネットが業界の長期的な収益性にどのようなインパクトを及ぼすのかについての一般的な結論を出そうとするのは間違いである。とはいえ、インターネットの特徴もあり、具体的にはインターネットによって顧客と直接接触できるようになれば流通チャネルの交渉力が弱まったり、業界の効率性を向上させ従来の代替品よりも相対的に優位なポジションに立つことができて市場全体が拡大したりなどがある。
反面、下記のような歓迎し難い変化も生じることは考えておく必要がある。

・買い手の交渉力の高まり
・参入障壁が低くなる
・新たな代替品が生まれる
・業界内の競争が激しくなる
・市場が地理的に拡大し、さらに多くの企業が競争に参加してくる
変動費を引き下げ、固定費の割合を高める

インターネットを使うことで市場は拡大するが、多くの場合同時に収益性が低下しがちなことは意識しておくと良い。インターネットのパラドックスは長所である情報を広く入手できるところにあり、これにより購買やマーケティング、流通においてこれまで問題だったことが解決され、売買が容易になるが、企業がこのような長所を利益として取り込むことが難しいことは注意が必要である。


5. インターネットの神話(簡単な要約)
こちらについては省略します。


6. 感想・まとめ
#7では第4章の『戦略とインターネット』の前編として、「インターネットの神話」までの内容についてまとめました。2節と5節については当時の文脈の影響が強すぎると思われたため、要約としては省略としました。
#8では第4章の『戦略とインターネット』の後編として、「インターネット競争の未来」以降について確認していきます。

確率分布のグラフ化&掛け算と対数|高校数学の演習を通して理解する確率分布と最尤法 #2

f:id:lib-arts:20191112170245p:plain

以前のシリーズで機械学習アルゴリズムであるニューラルネットワークやランダムフォレストに絡めて高校レベルの数学の様々なトピックについて取り扱いました。

上記ではニューラルネットワークやランダムフォレストを中心に取り扱いましたが、今回は確率分布と最尤法について取り扱っていきます。
#1では集合・確率と様々な関数(指数関数、対数関数)について取り扱いました。

集合・確率&様々な関数(指数関数、対数関数)|高校数学の演習を通して理解する確率分布と最尤法 #1 - lib-arts’s diary

#2では確率分布のグラフ化と、掛け算と対数について取り扱います。
以下、目次になります。
1. 例題③ 確率分布のグラフ化
2. 例題④ 掛け算と対数
3. まとめ

 

1. 例題③ 確率分布のグラフ化
1節では確率分布の関数の形について見るにあたって、関数の形のグラフ化を行なってみます。

ex.03
下記の関数をPythonを用いてグラフ化せよ。
1) f(x)=exp(-x^2)
2) f(x)=\frac{1}{\sqrt{2 \pi}}exp(-\frac{x^2}{2})
3) f(x)=\frac{1}{\sqrt{2 \pi × 2^2}}exp(-\frac{(x-3)^2}{2×2^2})

Answer.
1)
下記コードで実装できる。

import numpy as np
import matplotlib.pyplot as plt

x = np.arange(-3,3,0.1)
y = np.exp(-x**2)

plt.plot(x,y)
plt.show()

実行結果は下記のようになる。

f:id:lib-arts:20191112190446p:plain

2)
下記コードで実装できる。

import numpy as np
import matplotlib.pyplot as plt

x = np.arange(-3,3,0.1)
y = np.exp(-x**2/2)/np.sqrt(2*np.pi)

plt.plot(x,y)
plt.show()

実行結果は下記のようになる。

f:id:lib-arts:20191112191014p:plain

3)
下記コードで実装できる。

import numpy as np
import matplotlib.pyplot as plt

x = np.arange(-2,8,0.1)
y = np.exp(-(x-3)**2/(2*4))/np.sqrt(2*np.pi*4)

plt.plot(x,y)
plt.show()

実行結果は下記のようになる。

f:id:lib-arts:20191112191050p:plain

解説.
1)〜3)のどの関数も、正規分布をベースに作成しています。1)は大きさの調整を行っておらず、積分した値が1にならないので確率分布ではないということに注意です。2)と3)はどちらも正規分布が元になっていますが、2)は平均が0、分散が1の正規分布、3)は平均が3、分散が2^2=4正規分布を描画しています。

 

2. 例題④ 掛け算と対数
2節では最尤法の際に考えることの多い、対数尤度の理解につながるように掛け算と対数の話を取り扱います。#1の例題②で見たように、対数関数は単調増加関数のため、最大値問題を解くにあたってf(x)の最大値を取るxと、log(f(x))を最大にするxは一致します。したがって関数の最大値問題を考えるにあたって、対数関数を用いることがしばしばあります。

ex.04
下記の値を足し算の形に分解せよ。ただし\ln x\log_{e} xであるとする。
1) \log_{2} (xyz)
2) \ln (x_{1}x_{2}x_{3}x_{4})
3) \ln \Pi{x_{i}}

Answer.
1)
\log_{2} (xyz)=\log_{2} x + \log_{2} y + \log_{2} z
2)
\ln (x_{1}x_{2}x_{3}x_{4})=\ln x_{1} + \ln x_{2} + \ln x_{3} + \ln x_{4}
3)
\ln \Pi{x_{i}}=\ln x_{1} + \ln x_{2} + ... = \sum{\ln x_{i}}

解説.
今回見たように、対数関数を用いることで掛け算(積)の分解を行うことができます。最尤法では同時確率(joint probability)を尤度とみなすにあたって、サンプルの生成に独立性を仮定すると尤度は掛け算の式になります。この時、例題の2)や3)のように式が掛け算の形で与えられるのですが、最大値・最小値問題を解くにあたっては微分を用いることが多く、微分は掛け算よりも足し算の式の方がシンプルに計算ができるため、対数関数を用いて式の形を変更することで尤度の計算を簡略化することができます。
詳しくは例題の後の記事でまとめますが、今回の2)と3)の例題の変形は意識して把握しておいていただけると良いかと思います。


3. まとめ
#2では確率関数のグラフ化と、掛け算と対数について取り扱いました。
#3では合成関数の微分と最大値問題について取り扱います。