三流院生のデータ解析忘備録

データ解析等の情報をメモ書き程度のクオリティーで更新。Python, Fortran, bash, ArcGIS, Microsoft Office (Word, Excel, PowerPoint).

2017-11-18から1日間の記事一覧

Pythonで階層クラスター分析(Ward法) デンドログラムの作成

階層クラスター分析(ward法)に必要なライブラリはNumpy と Matplotlib, Scipy。 n人の生徒を3つの情報(例えば数学・国語・英語の点数)を使ってクラスタリングする場合を考える。 入力データ(score.csv)の並びは、 A1,1 B2,1 C3,1A1,2 B2,2 C3,2︙ ︙ …

Pythonで主成分分析

主成分分析に必要なライブラリはScikit-learn と Numpyだけ。 今回は時系列データに対して主成分分析を行う場合を考える。 地球物理の分野ではEOF解析とも呼ばれる。 n地点×24時間分の気温観測値が与えられているとする。 主成分分析によって気温の時間変動…

Matplotlibで作成したsvgファイルをemfファイルに変換

WordファイルをPDF変換したり、大きなスクリーンでプレゼンを行う場合には、拡大縮小に強いベクタ形式の画像が適している。 Microsoft Officeのソフトに挿入可能なベクタ形式はemfファイルであり、 他のepsやsvgファイルは非対応なので挿入するには少し手間…

WordからPDF変換する際に画質が落ちてしまう問題 【解決】

投稿論文がアクセプトされてから数日後、編集側から早期公開用のPDFファイルと高画質の図を提出してくださいとのメールが来た。 図は600 dpi以上が要求される。 査読段階で提出していたPDFファイルは画質にこだわっていなかったので、もう一度wordファイルか…