Beginner

ガウス過程に入るにあたっての前提知識の整理(Ch.1,Ch.2)|『ガウス過程と機械学習』読解メモ #1

最近購入した『ガウス過程と機械学習』ですが読んでいて面白いので読解メモをまとめていきます。 ガウス過程と機械学習 | 書籍情報 | 株式会社 講談社サイエンティフィク#1ではCh.1とCh.2の内容を元に事前知識の整理を行います。以下目次になります。 1. 線…

相関性の低い決定木の作成とランダムフォレスト|高校数学の演習を通して理解する決定木・ランダムフォレスト #5

#1〜#3では決定木やランダムフォレストについて理解するにあたってベースとなる例題について取り扱いました。 #4では上記の例題を受けて、実際に決定木の学習について解説しました。 #5では決定木の多数決にあたって、相関性の低い(独立性の高い)決定木を…

エントロピーと決定木の学習|高校数学の演習を通して理解する決定木・ランダムフォレスト #4

#1〜#3では決定木やランダムフォレストについて理解するにあたってベースとなる例題についてまとめました。 #4では上記の例題を受けて、実際に決定木の学習についてまとめていければと思います。以下、目次になります。 1. 決定木の概要と推論に関して2. 不…

ジニ係数と情報エントロピー|高校数学の演習を通して理解する決定木・ランダムフォレスト #3

上記ではニューラルネットワークを中心に取り扱いましたがその他アルゴリズムも取り扱えればということで、決定木・ランダムフォレストについて新規で連載をスタートしました。#1では微分の最小値問題の復習と関数の増減表について、#2では二項定理について…

二項定理と多数決|高校数学の演習を通して理解する決定木・ランダムフォレスト #2

上記ではニューラルネットワークを中心に取り扱いましたがその他アルゴリズムも取り扱えればということで、決定木・ランダムフォレストについて新規で連載をスタートしました。#1では微分の最小値問題の復習と関数の増減表について取り扱いました。https://l…

微分・最小値問題の復習と増減表|高校数学の演習を通して理解する決定木・ランダムフォレスト #1

機械学習を理解するにあたって数学は必要かという質問はよく聞かれますが、程度によりますが最低限は必要だと答えるようにしています。最低限というのも色々と考え方がありますが、個人的には高校数学〜大学の教養過程の導入(完璧までいかなくてもOK)ほど…

Python+SQLで実現する作業の自動化|非技術者のための業務効率化 #1

ここ最近学校でのプログラミングの必修化などの話が進んでいるなど、今後の世の中においてはプログラミングスキルの重要性が益々増してくると思われます。反面、現状は技術職でもなければプログラミングどころかPCスキルがなくても問題ないとされています。…

【入門者・初心者向け】【随時更新】Pythonで機械学習や統計モデリングをしたい方のための環境構築まとめ

Pythonを用いたプログラミングについて色々と書いていますが、環境構築についてがメインの記事が今までなかったのでこちらにまとめられればと思います。入門者・初心者向けに解説させていただく機会もしばしばあるので、その内容も踏まえた上で随時ベストエ…

極性辞書を用いたネガポジ分析|実践的自然言語処理入門 #5

#1〜#3まではBoWのような自然言語の行列形式とそれに派生して局所表現と分散表現の話をし、分散表現の例としてWord2vecについて取り扱いました。 BoWと形態素解析|実践的自然言語処理入門 #1 - lib-arts’s diary 特徴語抽出とtf-idf|実践的自然言語処理入…

Ch.4 データベース(NoSQLよりもRDBMSを中心とします)|『Webエンジニアの教科書』まとめ #4

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やフロントやる上でのデザイン…

cos類似度と文書分類|実践的自然言語処理入門 #4

#1〜#3まではBoWのような自然言語の行列形式とそれに派生して局所表現と分散表現の話をし、分散表現の例としてWord2vecについて取り扱いました。 #4では実際にベーシックなアルゴリズムを用いて簡単な応用タスクを解いてみようということで、cos類似度と文書…

分散表現とWord2vec|実践的自然言語処理入門 #3

#1ではBoWと形態素解析の導入、#2では特徴語抽出とtf-idfについて取り扱いました。 #3ではここまで出てきた疎行列(Sparse matrix)の取り扱いにあたって分散表現とWord2vecについて取り扱いたいと思います。以下目次になります。 1. 疎行列の取り扱いと局所表…

Ch.2 Ruby on Railsでの開発②|『Webエンジニアの教科書』まとめ #3

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やフロントやる上でのデザイン…

特徴語抽出とtf-idf|実践的自然言語処理入門 #2

#1では自然言語に教師あり学習を適用するにあたって、BoWと形態素解析の導入を行いました。 #2ではPoC開発などで用いやすい特徴語抽出とその有名なアルゴリズムであるtf-idfについてまとめられればと思います。以下目次になります。 1. PoC開発における特徴…

BoWと形態素解析|実践的自然言語処理入門 #1

時折自然言語処理のセミナーを行うのですが、毎回同じことを話すのもなかなか退屈なので、基礎知識を公開情報の形式で簡単にまとめていければと思います。#1では教師あり学習について簡単に復習した上で、言語処理の基本となるBoWと形態素解析について解説し…

Ch.2 Ruby on Railsでの開発①|『Webエンジニアの教科書』まとめ #2

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やWebデザインやる上でのデザ…

部分空間法と主成分分析(PCA)|はじめてのパターン認識9章 #6

#5では、11章の内容を取り扱いました。 #6では、9章の内容を部分空間法と主成分分析について取り扱えればと思います。以下、目次になります。 1. 9章内容(部分空間法)1.1 部分空間(9.1)1.2 主成分分析(9.2)1.3 特異値分解(9.3)1.4 部分空間法(9.4)1.5 ラン…

【未経験者・初心者向け】Ch.1 Webエンジニアについて|『Webエンジニアの教科書』まとめ #1

Web開発は本業ではないのですが勉強会など諸々運営しているとキャリア相談に乗ることもあり、数字や数学に強くない方に機械学習系は勧められない(高校レベルから復習する必要があるならコスパ度外視で努力する気がないなら諦める方が良い)のでWeb開発側の…

決定木とランダムフォレスト|はじめてのパターン認識11章 #5

#1では1章〜2章の内容、#2では3章〜4章の内容、#3では5,10章、#4では、6,7,8章の内容を取り扱いました。 #5では、11章の内容を決定木とランダムフォレストについて取り扱えればと思います。分量的に9章と同時に取り扱おうと思いましたが、全くの別概念なので…

データ分析・機械学習系での言語選択に関して

下記の記事でシステム設計について記述した内容に対し、言語選択についてご質問いただきましたので、こちらの記事で回答させていただければと思います。 ◆ Question 質問内容としては、冒頭部で『RではなくPythonを用いています』としたことに対して、 Rの問…

等比数列の極限として理解する勾配降下法|直感と数学 #2

『数学って難しそう』ってよく聞きますが、確かに数式だけ追ってると難しく感じる時もあるかもしれません。ですが、ちょっと視点を変えてみるだけで新しい洞察が得られる時があります。この直感的な感覚をわかっていただければということで、一見難しそうな…

Kerasチュートリアルに学ぶ簡単な実装|DeepLearningの実装 #1

ライブラリの使い方を中心に取り扱った記事は深い考察になりづらいのであまり書きたくないのですが、DeepLearning系は仕様の変化が早過ぎるので、DeepLearningの実装に関しては諸々のドキュメントのまとめを備忘録も兼ねてシリーズ化していければと考えてい…

関数近似で行う予測・識別|はじめてのパターン認識6,7,8章 #4

1では1章〜2章の内容、#2では3章〜4章の内容、#3では5,10章の内容を取り扱いました。 #4では、6,7,8章の内容をベースに関数で規則を構成する方法について取り扱えればと思います。以下、目次になります。 1. 6章内容(線形識別関数)1.1 線形識別関数の定義(…

簡単な計算で理解するポワソン分布|直感と数学 #1

『数学って難しそう』ってよく聞きますが、確かに数式だけ追ってると難しく感じる時もあるかもしれません。ですが、ちょっと視点を変えてみるだけで新しい洞察が得られる時があります。 この直感的な感覚をわかっていただければということで、一見難しそうな…

距離の尺度を用いた最近傍法とクラスタリング|はじめてのパターン認識5章,10章 #3

#1では1章〜2章の内容、#2では3章〜4章の内容を取り扱いました。 #3では5章,10章の内容をベースに距離を用いた識別規則の構築について取り扱えればと思います。以下、目次になります。 1. 5章内容(k最近傍法; kNN法)1.1 最近傍法とボロノイ境界(5.1)1.2 kN…

ベイズや確率モデルと統計|はじめてのパターン認識3章~4章 #2

#1では、機械学習の概要ということで、1章〜2章の内容を取り扱いました。 #2では3章〜4章の内容をベースにベイズの識別規則や確率モデルについて取り扱えればと思います。以下、目次になります。 1. 3章内容(ベイズの識別規則)1.1 ベイズの識別規則(3.1)1.…

機械学習の概論|はじめてのパターン認識1章~2章 #1

機械学習の入門書としてですが、PRMLは少々ごつい本なので、『はじめてのパターン認識』はそこまで分量も多くなくざっと読むには良いのではと思います。レベル感としても理工系の大学3,4年向けくらいでそこまでハードルも高くないです。とはいえ細部の記述が…

PRML上巻_5章 ニューラルネットワーク(Neural Network) 読解メモ #5

#4では4章の線形識別モデルについて取り扱いました。 #5では5章の読解メモをまとめていければと思います。(7~8割の理解を目標においた読解にあたってのメモなので、要旨を掴みたい方向けです)5章のニューラルネットワークは近年DeepLearningの台頭で多くの…

PRML上巻_4章 線形識別モデル(Linear Discriminant Model) 読解メモ #4

#3では3章の線形回帰モデルについて取り扱いました。 #4では4章の読解メモをまとめていければと思います。(7~8割の理解を目標においた読解にあたってのメモなので、要旨を掴みたい方向けです)4章の線形識別モデルはクラス分類などにつながる考え方です。以…

PRML上巻_3章 線形回帰モデル(Linear Regression Model) 読解メモ #3

#2では確率分布について取り扱いました。 #3では3章の読解メモをまとめていければと思います。(7~8割の理解を目標においた読解にあたってのメモなので、要旨を掴みたい方向けです)3章の線形回帰モデルは多くの機械学習や統計モデリングのベースとなる非常…