2020/01/24 情報福祉マネジメント学科

教員の声:データ分析の研究 第1回 岩田一樹講師

教員の声<不定期更新>
学科の教育や活動について学科教員の視点でまとめて報告します。初回の石野教授の学科行事に続く、第2回は、岩田講師によるデータ分析について4回に分けて掲載します。

旧年は、厄年でもないのに、アキレス腱を切ったりした情報福祉マネジメント学科 講師の岩田です。ちなみに、今年は前厄です。不安です。

さて、みなさん年末は何をして過ごされたでしょうか? 帰省? 餅つき? 大掃除? 年越しライブ? この記事をご覧の方々それぞれの過ごし方をなさったことと思います。かく言う私は、昨年末は家族で過ごしましたが、学生時代や子供がいなかった頃には、しばしば、東京ビックサイトを訪れていました。理由は、もちろん、昨年末に行かれた方もいらっしゃると思いますコミックマーケット、いわゆる、コミケに参加するためです。ちなみに、昨年末はC97です[1]。

混雑緩和のために企業とサークルはいいかげん分けるべきだ、という私見はさておいて、ここで、コミックマーケットの話題をあげたのは、比較的短期間(昨年の冬コミは東京オリンピックの影響で4日間)に延べ80万人弱の人々が一箇所にやってくる、そんなイベントはそうありません。しかも、そこに集まるのは、SNSにおいて活発に情報交換を行う方々が中心です。そのため、当然、その期間中、および、期間前後ではコミケに関する情報がSNS上には溢れています。

では、そんなSNSにおいて、コミケ97に関することでどんなことがわかるのか、興味がありませんか?

ということで、ここでは、SNSの1つであるTwitter[2]に注目して、コミックマーケット97に関する、つぶやきデータの分析した結果を紹介したいと思います。そして、それを通して、みなさんにデータ分析に興味を持ってもらって、おもしろそうだな、と思っていただけると嬉しいです。

まず、データの収集期間は2019年12月21日から2020年1月6日の間で、約140万のつぶやきを取得しました。なお、データ収集はTwitter API[3]で行い、検索に使ったワードは[コミックマーケット, コミケ, 冬コミ, コミックマーケット97, コミケ97, C97]とそれらのハッシュタグです。逆に言うと、これらの単語が含まれていないつぶやきは、それがコミケ関連の内容であっても、取得できていません。もっと入れるべきワードがあるよ! と思われる方もいらっしゃると思いますが、そう思われた方は、是非、そのワードを使ってご自身で試してみてください。なお、鍵アカからのデータは取得できません。

また、リツイートを含んでしまうと、データ数が1000万を超えてしまって、収集、分析が困難になるので、リツイートは取得していません。ちなみに、Twitterの場合、1000万つぶやきだと、保存する情報にもよりますが、APIで取得可能な情報すべて保存すると100ギガバイト超えのデータ量になります。

では、まず、数的な情報からみていきましょう。

図1 つぶやき数のヒストグラム
図1 つぶやき数のヒストグラム
図1は取得期間中につぶやかれたツイートを時刻でヒストグラム化したものです。

一目見て、5つ高い山、すなわち、つぶやき数が多い日があるのがわかります。その日にちは、それぞれ、27日、28日、29日、30日、31日で、これらはコミケの開催前日から終了日に相当しますので、コミケの開催期間をつぶやき数が反映しています。

また、大本営からのアフターレポートの発表では、来場者は28日:19万人、29日:18万人、30日:19万人、31日:19万人と言われていますので[4]、4日間の山の高さが、28日の10時付近(=初日の開場時刻付近)と31日の16時付近(=最終日の閉場時刻付近)を除いて、高さ、形がほぼ同じであることは、このつぶやき数が来場者数を反映していることを示唆していいます。

さらに、特異的な時刻である初日の開場時刻や最終日の閉場時刻も押して知ることが可能なことをあわせて考えると、少なくとも、Twitterのつぶやきからコミケ97の数的な特徴を捉えることは可能そうです。

また、コミケからは少し横道にそれますが、少し細かく見ると、開催期間の4日間を除いて、つぶやきの数に周期性がみられます。そして、その周期性は定性的に言って、1日の中で、つぶやき数が増えだした後に鋭いピークがあり、そして最大数を迎え、急に減るといった具合で、この振る舞いが繰り返されます。

この変化に関して、時刻を調べると、鋭いピークは12時と13時、そして、日々のピークは21時と22時で、これらから、お昼休みにTwitterを利用する方が多い、また、23時台からはつぶやき数がおちていることから、22時台でその日のTwitter を終了する方が多い、と考えられます。

したがって、人々がTwitterを眺めている可能性の高さからは、Twitterで自分の発言をバズらせたい人は、12時~13時、20時~22時を狙ってみるといいかもしれません。

1. コミックマーケット 97, https://www.comiket.co.jp/info-a/C97/C97info.html
2. Twitter, https://about.twitter.com/ja.html
3. Twitter API, https://help.twitter.com/ja/rules-and-policies/twitter-api
4. KAI-YOU, https://kai-you.net/article/70630
(第2回に続く)

この記事に関するお問い合わせ

教務部教務課
住所:〒981-8522 宮城県仙台市青葉区国見1−8−1
TEL:022-717-3315
FAX:022-301-1280
E-Mail:kyomu@tfu-mail.tfu.ac.jp