これなら使える!ビッグデータ分析基盤のエコシステム

第4回 ビッグデータ分析基盤のためのアドホック分析環境 ~導入編

この記事を読むのに必要な時間:およそ 2 分

Jupyterの基本的な使い方

“Hello World”してみる

トップ画面で,New -> Python3を選択し,Python3用のNotebookを作成します。この後は,Pythonのインタラクティブシェルと同様のことが可能になります。

とりえあず,最初はHello Worldをしてみましょう。下記を入力してShift+Enterで実行できます。

print('Hello World!')

図3 helloworld

図3 helloworld

Pythonが実行できることを確認できましたね。

このNotebookでの作業内容は .ipynb という拡張子を持つファイルに自動で保存されます。

また,グラフの描画をしたい場合には,事前に下記を実行しておきます。

%matplotlib inline

そして,下記のコマンドを実行してみましょう。

import matplotlib.pyplot as plt

plt.plot(range(100))

図4 visualize

図4 visualize

このように%を先頭に付けることで,マジック関数(Magic Function)と呼ばれる特別な関数がいくつか用意されており,インタラクティブな分析に役立ちます。また,先頭に!を付与すると,シェルのコマンドを実行することができます。

この他,マークダウンを埋め込むことも可能です。

図5 markdown

図5 markdown

また,ここで作成したnotebookをGithub上にアップロードすると,Jupyter上の表示そのままでGithub上で表示させることが可能です。

図6 github

図6 github

Jupyterまとめ

今回はJupyterのインストールと起動,簡単な利用方法について説明しました。Jupyterは,あくまでもインタフェースで,これだけで何か分析ができるわけではありません。しかし、分析の試行錯誤を簡単に記録できるようにしておくことで,そうした試行錯誤の過程をナレッジとすることができるのです。

次回は,Jupyterをインターフェースとして、データ分析ライブラリPandasの使い方を紹介します。

著者プロフィール

高橋達(たかはしとおる)

Treasure Data Inc.でテクニカルサポートエンジニアとして,毎日,日米問わず顧客のサポートを担当。サポートエンジニアのエンジニアとしての地位向上を目指して色々模索中。そのために,秋葉原幻橙館で今日も元気にOSS活動を行っている。

URL:http://toru-takahashi.gitbooks.io/secret-ninja/content/