knaka Tech-Blog

AI, IoT, DIYエレクトロニクス, データサイエンスについて投稿予定です。

pythonでデータサイエンス 初級

データ解析、機械学習で使用される統計などの技術
python の数学系ライブラリについての内容となります。

=========
参考は。大学さまの公開資料や、python数学系ライブラリの参考記事、
統計学の参考記事を参考にしています。より詳しく理解されたい方は
記載の用語などを検索したり。各ページの関連URLを参考下さい。

参考のページ:
http://weblab.t.u-tokyo.ac.jp/gci_contents/

jupyter notebook形式のファイルは、
事前に実行環境を準備が必要になりそうです。
=========

numpy の機能

python の数学系ライブラリnumpy 機能の説明となります。
データサイエンス、機械学習の前処理でよく使われるようです。


numpy の配列作成, array() arange() zeros() ones()
knaka0209.hatenablog.com



numpy のsort() min() max() sum()
knaka0209.hatenablog.com


numpy のrandom randn()
knaka0209.hatenablog.com


numpy の行列の作成
knaka0209.hatenablog.com

pandas の機能

pandas Series
knaka0209.hatenablog.com


pandas DataFrame
knaka0209.hatenablog.com


pandas merge()
knaka0209.hatenablog.com


pandas sort_values()
knaka0209.hatenablog.com


pandas info()
knaka0209.hatenablog.com

統計の初級編

 分散、標準偏差、要約統計量
knaka0209.hatenablog.com

 確率
knaka0209.hatenablog.com