sifue's blog

プログラマな二児の父の日常 ポートフォリオは www.soichiro.org

Twitterボット作成サービス キャラボットのユーザー調査

http://sourceforge.jp/projects/charactorbot/wiki/Servers

のURLで管理しているキャラボットのサーバー一覧で、自分が管理しているキャラボットのユーザーの調査を行ないました。


やり方は、全てのアプリケーションのremote_apiを仕組んでCSVでappcfg.pyでダウンロード、その後はsqliteにデータを入れてPythonExcelを使ってデータをまとめました。結果は以下のとおり。


■キャラボット内データ調査(概要)
・時期: 2010年8月10日
・対象: charactorbot〜charactorbot54の全54のアプリケーションのdatastoreのデータ


◯集計概要


現在、総登録ボット数が3293ボット。公開日が2010年4月17日なので、月800ボットぐらいづつ増えている計算になります。ユーザー数は、1985名なので、一人当たり平均1.6ボットほど運営しています。一番多い方で25ボットも運営されていて、本当にすごいです。


正規表現も大体11万の返信用キーワードのうちの4割近くに使われています。正規表現の認知度の高さがうかがわれます。正規表現自体は、かなりプログラマブルな機能なので、そもそもキャラボットの利用者のプログラミングのリテラシはかなり高いんじゃないかと予測されます。逆に言えば、正規表現の"せ"の字もわからない方には、キャラボットは厳しいアプリなのかもしれません。


投稿内容に関しては、自分宛返信の投稿内容が全体の53%で27万個です。これも当初の狙い通りで、会話するボット、キャラクターを表現するためのボットという立ち位置がはっきりしている証拠だと思います。逆にフォローへのあいさつの登録は、ほとんどなくあまり重要視されていないのかもしれません。


タイムゾーン


あとタイムゾーンに関してですが、数こそ少ないものの、全部で44個のタイムゾーンから利用されていました。ヘタリアというジャンルの影響で一時期いろんなタイムゾーンのボットが増えたことも疑われましたが、ちゃんとそちらの言語で内容も表記されているためちゃんと現地から使われているようです。


◯各種統計


◯ユーザー毎のボット数のパレート図


◯ボット毎キーワード数のパレート図


◯ボット毎投稿内容数のパレート図


各種統計類、ヒストグラムを見ると綺麗にガウス分布。ボットを作り込む際に何かの障壁があるということもなくうまく使われているようです。ただ、7割のユーザーが1つしかボットを作っていないので、Googleアカウントをかませたことは、結構ログインの負担になっている可能性があります。加えて投稿内容も3割近いボットが、100〜200の投稿内容を登録されているようです。かなり時間をかけて作ってもらっています。普通の人にとっては、ひとり一つのボットの運営でかなりの労力を使うのかもしれません。



あと、キャラクタージャンルも登録投稿内容の多い順に20個抽出してみました。

トリックスター
ヘタリア
オリジナル
声優
オリジナル
ナルト
オリジナル
個人
デュラララ
ガンダムW
逆転裁判
ヘタリア
逆転裁判
ヨーグルティング
オリジナル
オリジナル
リボーン
仮面ライダーキバ
リボーン
エンジェルビーツ


という感じです。二次創作ジャンルがメインとは言え思ったよりオリジナルが多く、特にpixivなどでの創作活動のキャラのキャラクターの性格を保管するものとして使われているようです。キャラボットは、まさにキャラクターを表現するための創作活動に作っているので、このような活動はぜひ応援したいと思います。


あと二次創作系のものは黙認されているものがほとんどだと思いますが、さすがに版権や肖像権の厳しそうなものは避けられている様子でした。


以上が今回の調査の概要でした。


キャラボットの方も本当に沢山の方に使って頂けるようになって感謝の限りです。Googleの無料のリソースを使って、できるだけ効率よくボットを動かすというのは結構難しいところもありますが、今後もソースだけ利用する方も含めて、創作活動を応援していきたいところです。


機能開発の方はそろそろ落ち着いてきたこともあって、これからはサーバー(アプリケーション)増やしと、GAEやTwitterのバージョンアップへの追従をメインにやっていきます。それとは別に今回集めさせてもらったボットのデータを個人情報の取扱には気をつけながら、データマイニングを通じて新たなサービスやキャラボットの機能を考えるためのタネにさせてもらおうと思っています。
最近、四時じゃねーのサービスで、OAuthアプリ乗っ取り事件などがありましたが、そのようなことがないように情報漏えい、セキュリティには気を使っていく予定です。今後ともどうぞよろしくお願いします。


追伸
今回はじめてPythonsqliteをじっくり使ってみましたが、ちょっとしたデータマイニングにはとっても便利です。Pythonには様々な数学モジュールやRのライブラリもあるので、今後挑戦していきたいところ。ちなみにGAEのdatastoreのエクスポートやsqliteのへのインポートは別途エントリーを書きました。