濃縮還元オレンジニュース

Microsoft Researchが開催するスペル修正コンテスト「Speller Challenge」

この記事を読むのに必要な時間:およそ 0.5 分

MicrosoftはWeb検索エンジンにBingを使っていることで知られていますが,Bingの技術研究を担っているMicrosoft Researchがスペル修正の品質を競うコンテストを開催しています。主要Web検索エンジンにはスペル修正機能が備わっており,Googleの「もしかして: ◯◯◯」という表示でお馴染みです。コンテスト自体は2011年1月17日に始まり5月27日まで受け付けています。

ルールは与えられたデータセットをもとにスペル修正機能を開発し,任意の場所でREST形式のWebサービスを用意します。優秀者には賞金が用意されており,1位の賞金額はなんと10,000ドルです。

学習データとして6,000弱の検索クエリが提供されており,300ほどのスペルミスが含まれています。個人的にスペルミスの量が少なすぎるように思うので,良い成績を狙うには各自で何らかのデータ収集は必要かと思います。

2004年に発表されたSilviu Cucerzan氏とEric Brill氏の論文によると,Web検索クエリの約10縲・5%はスペルミスが含まれているそうですので,スペル訂正機能は検索エンジンにおいて非常に重要な機能であることがわかります。このコンテストを通じてBingの品質向上につなげていくのかもしれません。腕に自信のある方(ルールによりMicrosoft関連社員は参加できないようです)は挑戦してみてはいかがでしょうか。なお,スペル修正機能の簡単な実装であればPeter Norvig氏が20行あまりのPythonコードにて紹介しています

URLhttp://web-ngram.research.microsoft.com/spellerchallenge/

著者プロフィール

角田直行(かくだなおゆき)

普段はお仕事でPHPやJavaを使ってWeb開発をしています。一部でセレブエンジニアとか言われてますが,全然セレブじゃありません。

コメント

コメントの記入