Start Python Clubは,
Start Python Club設立のきっかけ
- ――Start Python Clubは今年で3年を迎えるそうですね。おめでとうございます。時々イベントに参加させてもらっていますが,
いつも大勢の方でにぎわっていて楽しいコミュニティだと思います。Stapyは3年前にどのように始まったのでしょうか? 元々, 阿久津さんと辻さんは知り合いだったのですか? 阿久津:いいえ,
元々知り合いだったわけではありません。私は2014年にPythonの勉強を始めたのですが, 最初に手に取った書籍が辻さんの 『Pythonスタートブック』 でした。全くの初心者でしたが, スタートブックはとてもわかりやすくて, 1ヵ月ほどで読み終え, 基本を覚えました。 しかし,
その後数か月かけて学習を続けたものの, なかなか業務に使えるレベルまで成長できずに, 悩んでいました。その頃, 偶然, 高校時代のバスケ部の後輩Aさんが辻さんの所属する研究室で一緒に働いていることを知りました。周りに誰も悩みを相談できるメンターがいなかったので, すがる思いでAさんにお願いして, 辻さんと会う機会を作ってもらいました。 辻:最初にお会いしたのが3年前の4月でしたね。Aさんとのつながりが知り合うきっかけになりました。勉強方法や周辺の技術などについて,
いろいろとアドバイスをしましたが, 阿久津さんと話しているうちに, プログラミングをどのように学べばよいか, わからなくて困っている人が多くいることに気づきました。当時のプログラミング勉強会の多くは, 技術を知っているエンジニアが主催していましたが, 初心者には敷居が高い傾向がありました。阿久津さんとは初対面でしたが, お互い意気投合して初心者目線の勉強会を開催することになりました。 最初のStart Python Club
(以下 「Stapy」)の勉強会は, 2015年5月にここ, 東京大学駒場キャンパスで開催しました。 - ――なるほど。初めて使った会場がこちらなんですね。
阿久津:そうです。あのときはスタッフも含めて18名のこじんまりした勉強会でした。初回は私と辻さん,
それからMapRの草薙さんの3人が発表しました。実は草薙さんもAさんと同じく高校のバスケ部のつながりでして, 人の縁でできた手作りのイベントでした。 人の縁という意味では,
リーディング・ エッジ社の岸さんと知り合ったこともStapyにとってもは重要でした。初回の勉強会で, 「このイベントは面白いから, 次回以降はウチの会場を使いませんか?」 と言ってくれたのは, 本当にありがたかったです。第2回以降は, 毎月リーディング・ エッジ社の親会社であるクリーク・ アンド・ リバー社さんの会場を借りてイベントを開催しています。継続的に一定の場所を使うことができたおかげで, Stapyの活動が続いたと思います。岸さんをはじめ, リーディング・ エッジ社さんにはとても感謝しています。 辻:そのとおりですね。岸さんにはとても感謝しています。同じく初回に参加していた,
Akari Inc.の山下さんには第2回から企画スタッフに入ってもらっていますし, 常連の参加者だった阿部一也さんには, 今では企画で大活躍していただいています。ほかにもボランティアで参加しているスタッフがたくさんいて, 人の縁でできているコミュニティですね。 Pythonはいろいろな処理を自動化するのにも役立つので,
ビジネスマンや学生向けに, 業務を効率化するためのツールとしてPythonを学んでもらおうと, 最初の数回は 「業務のためのPython勉強会」 と名乗っていました。その後, 初心者からマスターまで集まってもらうため, 「みんなのPython勉強会」 と名前を変えました。 正直なところ,
最初は2, 3回も続けばいいかな~と思ったいたんですよね (笑)。勢いで始めたけれど, まさか3年間も続くとは思いませんでした。やはりPythonにプログラミング言語としての勢いがあり, 盛り上がってきたことが大きいと思います。
Pythonが盛り上がった背景
- ――なぜPythonが盛り上がってきたのでしょう?
辻:Pythonはオープンソースの汎用のスクリプト言語で,
いろいろな用途に使われています。とくにこの数年は, データサイエンスへの応用が盛り上がっています。 元々,
コンピュータは手計算に頼っていた科学技術計算を, 自動処理することで高速化することを目的に発明された機械ですから, 昔からプログラミングを使ったデータ解析は行われています。私の専門はバイオインフォマティクスですが, この分野ではRやSAS, Excelなどのツールが使われていました。しかし, ある処理はR, ほかの処理はExcelのように, データ処理の工程全体を一気に行えるツールがありませんでした。ところがオープンソースのPythonが普及して, パッケージも豊富になってくると, ユーザが増えて, それがさらに開発を加速するという好循環が生まれたんですね。Stapyが発足した2015年ごろは, まだRの方がプラットフォームとしては主流でしたが, その後, RからPythonに多くの人が流入してきました。 データサイエンス界で有名なKDNuggetsのサイトでは,
毎年データサイエンティストが使うツールについてアンケートが発表されるのですが, 2017年末にはPythonのユーザ数がRのユーザ数を上回るようになりました。 - ――多くのデータサイエンティストがオープンソースソフトウェア
(OSS) を使うようになったのですね。ここはもう少し聞いてみたいです。なぜデータ解析のツールとしてとくにPythonが盛り上がったのでしょう? 辻:いくつかの原因があると思いますが,
まず可読性つまりリーダビリティが高いことが挙げられます。Pythonは可読性に優れたスクリプト言語です。同時に, 予約語が少ないので, コードを書くのも楽で, あまりプログラミング経験がない人でも, 比較的簡単にスキルを習得できます。プログラミングを専門としない研究者やエンジニアであっても, オープンソースで提供されている機械学習や統計のパッケージを使えば, スクラッチでプログラミングをすることなく, 容易に結果を出すことができるため, ユーザが増えました。 次に,
オープンソースであることが挙げられます。科学技術分野ではデジタル信号処理や遺伝子解析など特殊用途のライブラリが整っているMATLABやMathematicaといったライセンスソフトウェアを使うユーザも多かったのですが, Pythonではnumpyをはじめ, scikit-learnやpandas, matplotlibなどの計算ライブラリが充実したことで, ライセンスソフトからオープンソースのPythonに移行するユーザが増えました。今では一部の分野で, 商用のライセンスソフトよりも高機能なライブラリをPythonが提供しているケースもあるほどです。 最後に,
Pythonはデータ解析にとどまらず, ウェブアプリやサーバ構築など, マルチに使える汎用性が高いことが挙げられます。Pythonはurllibやrequestsなどのウェブ関連のライブラリや, DjangoやBottleといったウェブフレームワークが利用できます。numpyなどの計算ライブラリを使って, データ処理のパイプラインをPythonで一気通貫に実行した上で, さらにウェブサービスのバックエンドまでカバーできるので, 非常に強力なツールとなります。 阿久津:それから,
AI分野の盛り上がりがさらにPython人気に拍車をかけたと思います。Stapyの活動を開始した2015年は, 秋ごろにTensorFlowやChainerといった深層学習パッケージがPythonのライブラリとして公開されました。当時の勉強会の参加人数は30~50人くらいでしたが, 機械学習やデータ解析を特集にすると, 明らかに参加者が増えました。参加者からアンケートを取ると, AIに注目している人が多かったので, AI分野の盛り上がりが, Pythonを盛り上げるひとつの要因になったと思います。