台湾で開催された「PyCon APAC 2014」参加レポート

#1 PyCon APAC 2014開催の台湾へ,そしてイベント1日目の模様

この記事を読むのに必要な時間:およそ 4 分

イベント初日

会場

関根です。会場となる Academia Sinicaは市街地からは結構離れており,宿泊した台北市内のホテルからの移動は,MRTとタクシーを利用しました。MRTにて約20分ほど,そこからタクシーで約10分ほどで会場に到着しました。

会場はAcademia Sinica(中央研究院)の敷地内にある人文社会科学館という建物でした。Academia Sinicaは台湾の学術研究機関です。敷地も大きく緑が豊富でとても素晴らしい場所でした。他のオープンソース関連のイベントでも非常によく利用されているようです。

Academia Sinicaに到着後,人文社会科学館ビルまで徒歩で10分程かかりますので,歩いて移動しました。

Academia Sinica

画像 画像

人文社会科学館

画像

受付とノベルティ

受付の場所は複数あり,登録の時に利用した電話番号の下3桁の数字によって,並ぶ場所が変わる方式でした。登録時に発行されたチケットにも番号があり,その番号と勘違いして違う場所に並んでしまう方が多かったです(私も間違えた1人です⁠⁠。

受付の様子

画像

受付では,名札とノベルティーをいただきました。ノベルティーにはトートバック,Tシャツ,ステッカーなどがあり,Tシャツは白をベースに素敵なデザインで,Python関連のイベントがあれば着用したいと思いました。

ノベルティ

画像

Keynote: Python-powered Business Analytics

宵です。今回始めの基調講演には,データ分析用フレームワークpandasを作り,⁠Python for Data Analysis』を出版したWes McKinney氏が登壇しました。

まずは,Business Intelligence,Bussiness Analysis,ETL(Extract, Transform, Load;データの抽出,変換,加工のこと⁠⁠,並びにPython用データサイエンス向けのカンファレンスPyDataを紹介しました。次にpandasの利点と欠点,最後に自身の会社で作成しているdatapadというBIツールを説明しました。

datapadはサンフランシスコにある会社なのでTreasureDataとも競合するのではないかいかと思い,⁠TreasureDataはご存じですか」と質問したところ,⁠名前は知ってるがどんな会社か把握してない」という感じの返答をもらいました。

Wes McKinney氏の基調講演

画像

Keynote: Open Source and Open Science: how Python and its community made me a better scientist

次の基調講演はFernando Perez氏が登壇しました。

この基調講演ではひたすら ipython notebookを使っていろんなものを表示しました。特にD3.jsと絡めてPlot内容をインタラクティブに操作できるあたりがよかったです。

話によれば,クイズで賞金王をとった人工頭脳,IBMのワトソンもipython notebookで対話してたようです。またipython notebookという名前ですが,Rubyなど多言語のサポートも行われつつあるようです。

Fernando Perez氏の基調講演

画像

セッション

発表の部屋は4個所ありました。基調講演は全部の部屋で中継して合同で見れるようにして,この時間帯以外は各部屋で個別の発表がありました。昨年からデータサイエンス向けの発表が数件ありますが,今回はなんと1日中scipy及びデータマイニング関係の発表をしている部屋がありました。ここでは参加したセッションからいくつか内容を紹介します。

Python for High School Students

寺田です。このセッションは,シンガポールのSong Kai氏他,高校生3人による実習の成果を発表しました。それぞれの成果は次の3つでした。

  • Google App EngineでSNSを作り,高校の中で使うもの
  • Google App Engineで構築した,フードコートのランチの人気や待ち時間を予想するサービス
  • OpenCVを使って提出物の文字を判定するツール

どれも完成度が高く高校生が作ったものとは思えませんでした。

セッション中に話が出ていましたが,シンガポールの高校生がみんなコンピュータに興味がありこのように勉強しているのではなく,ほとんどの高校生は興味がないということで,自分たちはマイノリティーだと述べていました。

引率の先生が一緒に来ていましたが,高校生の時から海外のカンファレンスで発表することは素晴らしいと思いました。

Python for High School Studentsの発表

画像

PySpark: next generation cluster computing engine

宵です。Yahoo TaiwanのWisely Chen氏の発表ではSparkについて,利点とPythonからの使い方,さらにMovie Lensデータの分析でMapreduceより速いことについて紹介しました。

SparkはHadoopのMapReduceのような大規模並列計算エンジンで,MapReduceよりも10倍以上早いと言われるフレームワークです。さらにSparkはチュートリアルがPythonとScalaユーザ向けに書かれており,JavaでMapReduceを書くよりも気軽に書けるようになっています。ただし途中の計算データは全部メモリ上展開されるため,メモリを思いっきり食います。

本発表では比較的簡単に導入できると説明が進んでいきました。しかしセッションの後に本人に聞いたところ,実際に使ってる環境では,用途ごとに1台あたりメモリを40~100GB程度積んでると聞きました。

TextBlob: Text Analytics for Human

Ken Hu氏の発表はScipyの発表ではなく,nltkという自然言語処理のツールを使って,文章の分割,感情分析,句構造情報の付与などを説明しました講演資料はこちら⁠。

Ken Hu氏の発表

画像

Real-time visualization with Python and d3.js

関根です。Muyueh Lee氏は,Pythonとd3.jsを組み合わせたデモを用いて,発表しました。具体的には過去10年間の台湾の野菜の競り価格のデータを分析し,その結果をビジュアライズして表示するデモを行っていました。膨大なデータを分析して,表示することで,今まで見えなかった傾向や発見があることを伝えていました。

Muyueh Lee氏の発表

画像

著者プロフィール

宵勇樹(よいゆうき)

PyCon JP 2012お手伝い。PyCon TW 2013でもレポート執筆。

業務は大規模データ処理環境の構築運用や見える化ツールの運用など。Pythonは主にTwitter Botを作るのに使用。機械学習にも興味があり,PRML勉強会,R,Web Mining系の勉強会を主催,参加。

Twitter:@showyou


関根裕紀(せきねひろのり)

複数のスタートアップにて,さまざまなWebアプリケーション開発に携わったあと,アライドアーキテクツ(株)に入社。業務では主にWebサービスの開発全般を担当している。5,6年ほど前にPythonを使用して以来,Pythonが好き。PyCon JP 2015 副座長(プログラム),また月に一度の勉強会である「Pythonもくもく会」を主催している。

Twitter:@checkpoint


寺田学(てらだまなぶ)

一般社団法人PyCon JP代表理事

昨年(2013年)日本で開催されたPyCon APACの座長。他には(株)CMSコミュニケーションズ代表,Zope/Ploneの専門家として,大学系・公共系などのCMSコンサルティングや構築を手がけている。Ploneコアコミッターとして,Plone4の日本語検索部分を担当した。その他にもオープンソース各種プロダクトを公開している。また、国内ではPlone Users Group Japanにて中心的に活動を行っている。共著書に、『Plone 4 Book』(Talpa-Tech Inc.),『10日でおぼえる Python 入門教室』(翔泳社),『FFmpegで作る動画共有サイト』(毎日コミュニケーションズ)他がある。

Twitter:@terapyon

バックナンバー

台湾で開催された「PyCon APAC 2014」参加レポート