Beginner

集合・確率&様々な関数(指数関数、対数関数)|高校数学の演習を通して理解する確率分布と最尤法 #1

機械学習を理解するにあたって数学は必要かという質問はよく聞かれますが、程度によりますが最低限は必要だと答えるようにしています。最低限というのも色々と考え方がありますが、所見としては高校数学〜大学の教養過程の導入(完璧までいかなくてもOK)ほ…

Ch.13〜Ch.15&本全体のまとめ|『リーダブルコード』読解メモ #7

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.11~12(一度に1つのことを&コードに思いを込める)|『リーダブルコード』読解メモ #6

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.9~10(変数と読みやすさ&無関係の下位問題を抽出する)|『リーダブルコード』読解メモ #5

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.7~8(制御フローを読みやすくする&巨大な式を分割する)|『リーダブルコード』読解メモ #4

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.5~6(コメントすべきことを知る&コメントは正確で簡潔に)|『リーダブルコード』読解メモ #3

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.3~4(誤解されない名前&美しさ)|『リーダブルコード』読解メモ #2

コーディングにあたっての指針を示しておければということで、『リーダブルコード』を課題本に設定しまとめています。(基本的に本を片手にご確認いただく前提なので、細かいところの記述は省略すると思います。勝手に解釈した上での要約なので、万が一解釈…

Ch.1~2(理解しやすいコード&名前に情報を詰め込む)|『リーダブルコード』読解メモ #1

Pythonのプログラミングについてのシリーズを書いているのですが、Pythonそのものについては#10をもって終了したので、もう少し広い視点でのコーディングについてもまとめておければと思い『リーダブルコード』を課題本に設定しまとめていきます。 O'Reilly …

ガウス過程に入るにあたっての前提知識の整理(Ch.1,Ch.2)|『ガウス過程と機械学習』読解メモ #1

最近購入した『ガウス過程と機械学習』ですが読んでいて面白いので読解メモをまとめていきます。 ガウス過程と機械学習 | 書籍情報 | 株式会社 講談社サイエンティフィク#1ではCh.1とCh.2の内容を元に事前知識の整理を行います。以下目次になります。 1. 線…

相関性の低い決定木の作成とランダムフォレスト|高校数学の演習を通して理解する決定木・ランダムフォレスト #5

#1〜#3では決定木やランダムフォレストについて理解するにあたってベースとなる例題について取り扱いました。 #4では上記の例題を受けて、実際に決定木の学習について解説しました。 #5では決定木の多数決にあたって、相関性の低い(独立性の高い)決定木を…

エントロピーと決定木の学習|高校数学の演習を通して理解する決定木・ランダムフォレスト #4

#1〜#3では決定木やランダムフォレストについて理解するにあたってベースとなる例題についてまとめました。 #4では上記の例題を受けて、実際に決定木の学習についてまとめていければと思います。以下、目次になります。 1. 決定木の概要と推論に関して2. 不…

ジニ係数と情報エントロピー|高校数学の演習を通して理解する決定木・ランダムフォレスト #3

上記ではニューラルネットワークを中心に取り扱いましたがその他アルゴリズムも取り扱えればということで、決定木・ランダムフォレストについて新規で連載をスタートしました。#1では微分の最小値問題の復習と関数の増減表について、#2では二項定理について…

二項定理と多数決|高校数学の演習を通して理解する決定木・ランダムフォレスト #2

上記ではニューラルネットワークを中心に取り扱いましたがその他アルゴリズムも取り扱えればということで、決定木・ランダムフォレストについて新規で連載をスタートしました。#1では微分の最小値問題の復習と関数の増減表について取り扱いました。https://l…

微分・最小値問題の復習と増減表|高校数学の演習を通して理解する決定木・ランダムフォレスト #1

機械学習を理解するにあたって数学は必要かという質問はよく聞かれますが、程度によりますが最低限は必要だと答えるようにしています。最低限というのも色々と考え方がありますが、個人的には高校数学〜大学の教養過程の導入(完璧までいかなくてもOK)ほど…

Python+SQLで実現する作業の自動化|非技術者のための業務効率化 #1

ここ最近学校でのプログラミングの必修化などの話が進んでいるなど、今後の世の中においてはプログラミングスキルの重要性が益々増してくると思われます。反面、現状は技術職でもなければプログラミングどころかPCスキルがなくても問題ないとされています。…

【入門者・初心者向け】【随時更新】Pythonで機械学習や統計モデリングをしたい方のための環境構築まとめ

Pythonを用いたプログラミングについて色々と書いていますが、環境構築についてがメインの記事が今までなかったのでこちらにまとめられればと思います。入門者・初心者向けに解説させていただく機会もしばしばあるので、その内容も踏まえた上で随時ベストエ…

極性辞書を用いたネガポジ分析|実践的自然言語処理入門 #5

#1〜#3まではBoWのような自然言語の行列形式とそれに派生して局所表現と分散表現の話をし、分散表現の例としてWord2vecについて取り扱いました。 BoWと形態素解析|実践的自然言語処理入門 #1 - lib-arts’s diary 特徴語抽出とtf-idf|実践的自然言語処理入…

Ch.4 データベース(NoSQLよりもRDBMSを中心とします)|『Webエンジニアの教科書』まとめ #4

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やフロントやる上でのデザイン…

cos類似度と文書分類|実践的自然言語処理入門 #4

#1〜#3まではBoWのような自然言語の行列形式とそれに派生して局所表現と分散表現の話をし、分散表現の例としてWord2vecについて取り扱いました。 #4では実際にベーシックなアルゴリズムを用いて簡単な応用タスクを解いてみようということで、cos類似度と文書…

分散表現とWord2vec|実践的自然言語処理入門 #3

#1ではBoWと形態素解析の導入、#2では特徴語抽出とtf-idfについて取り扱いました。 #3ではここまで出てきた疎行列(Sparse matrix)の取り扱いにあたって分散表現とWord2vecについて取り扱いたいと思います。以下目次になります。 1. 疎行列の取り扱いと局所表…

Ch.2 Ruby on Railsでの開発②|『Webエンジニアの教科書』まとめ #3

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やフロントやる上でのデザイン…

特徴語抽出とtf-idf|実践的自然言語処理入門 #2

#1では自然言語に教師あり学習を適用するにあたって、BoWと形態素解析の導入を行いました。 #2ではPoC開発などで用いやすい特徴語抽出とその有名なアルゴリズムであるtf-idfについてまとめられればと思います。以下目次になります。 1. PoC開発における特徴…

BoWと形態素解析|実践的自然言語処理入門 #1

時折自然言語処理のセミナーを行うのですが、毎回同じことを話すのもなかなか退屈なので、基礎知識を公開情報の形式で簡単にまとめていければと思います。#1では教師あり学習について簡単に復習した上で、言語処理の基本となるBoWと形態素解析について解説し…

Ch.2 Ruby on Railsでの開発①|『Webエンジニアの教科書』まとめ #2

#1では連載の経緯と課題本とした『Webエンジニアの教科書』の1章についてまとめました。 詳細は#1を読んでいただければと思いますが、技術開発系の仕事をするにあたってはこだわりや尖ったスキル(例えば機械学習やる上での数学やWebデザインやる上でのデザ…

部分空間法と主成分分析(PCA)|はじめてのパターン認識9章 #6

#5では、11章の内容を取り扱いました。 #6では、9章の内容を部分空間法と主成分分析について取り扱えればと思います。以下、目次になります。 1. 9章内容(部分空間法)1.1 部分空間(9.1)1.2 主成分分析(9.2)1.3 特異値分解(9.3)1.4 部分空間法(9.4)1.5 ラン…

【未経験者・初心者向け】Ch.1 Webエンジニアについて|『Webエンジニアの教科書』まとめ #1

Web開発は本業ではないのですが勉強会など諸々運営しているとキャリア相談に乗ることもあり、数字や数学に強くない方に機械学習系は勧められない(高校レベルから復習する必要があるならコスパ度外視で努力する気がないなら諦める方が良い)のでWeb開発側の…

決定木とランダムフォレスト|はじめてのパターン認識11章 #5

#1では1章〜2章の内容、#2では3章〜4章の内容、#3では5,10章、#4では、6,7,8章の内容を取り扱いました。 #5では、11章の内容を決定木とランダムフォレストについて取り扱えればと思います。分量的に9章と同時に取り扱おうと思いましたが、全くの別概念なので…

データ分析・機械学習系での言語選択に関して

下記の記事でシステム設計について記述した内容に対し、言語選択についてご質問いただきましたので、こちらの記事で回答させていただければと思います。 ◆ Question 質問内容としては、冒頭部で『RではなくPythonを用いています』としたことに対して、 Rの問…

等比数列の極限として理解する勾配降下法|直感と数学 #2

『数学って難しそう』ってよく聞きますが、確かに数式だけ追ってると難しく感じる時もあるかもしれません。ですが、ちょっと視点を変えてみるだけで新しい洞察が得られる時があります。この直感的な感覚をわかっていただければということで、一見難しそうな…

Kerasチュートリアルに学ぶ簡単な実装|DeepLearningの実装 #1

ライブラリの使い方を中心に取り扱った記事は深い考察になりづらいのであまり書きたくないのですが、DeepLearning系は仕様の変化が早過ぎるので、DeepLearningの実装に関しては諸々のドキュメントのまとめを備忘録も兼ねてシリーズ化していければと考えてい…