mknkisk report

Java, Solr, Animation

第二回ニコニコ学会β データ研究会@ドワンゴ新オフィス に行ってきました

| Comments

nicogakkaidata2

第二回ニコニコ学会β データ研究会@ドワンゴ新オフィス に行ってきました。

各発表のスライドは こちら でまとめてくださっています。 ありがたや。

ドワンゴ新オフィスに行ってみたかったという動機ではありましたが非常に 面白かったです。 数日経ったにも関わらずまとめられてませんがせっかくなのでメモ書きを アップしようと思います。

全体の雰囲気の感想としては今まで参加してきた勉強会とは違った 理系 の勉強会だったように思いました。 データで社会を見てる感じが非常に面白かったです。

Windows率と眼鏡率がこんなに高い勉強会も初めてだったように思います。

それではタイムスケジュール順にざっとメモ書きを。

概論

全体プログラム by 伊予柑 さん

  • ニコ生で流れます。
  • 発表終わったら拍手しましょう。めざせ 120db。
  • 発表終わったら紙にコメント書いてね。

最近のデータ分析の潮流 by 武田 先生

  • ソーシャルメディア データ
    • 掲示板, ブログ, Wiki, 投稿, SNS etc
    • 大量, 個人性, 社会性, オープン性, 時間性(リアルタイム)
    • ソーシャルセンサー
      • 震源予測, whotwi
  • ビッグ データ
    • 明確な定義はない。とにかく大きい。
  • オープン データ

    • 誰でも自由に
    • 再利用, 再配布
    • CCライセンス
  • ソーシャルデータから社会分析 が多い

  • ソーシャルメディアの中の分析をもっとやりたい

世界ボーカロイド大会 データ研究会報告 by ありらいおん さん

  • ボカロ好きが集まったイベント。 150人。
  • 朝はラジオ体操じゃなくて 踊ってみた w
  • データで見るN次制作
  • 2012-2013 みくぱんつデータ

ニコニコデータセットセッション

公開データの説明 by 濱崎雅弘 さん

  • ニコニコデータセット
    • 誰でもDL可能
    • メールアドレスの連絡, 指名(HN可)
    • 300GBのメタデータ
    • 2000ファイル分割
    • API公開ではなくDL公開
  • データ
    • 動画データ
    • コメントデータ
    • UIDはついてない
  • 解析してみた
    • 拍手コメント(888) の長さ

トピックモデルを用いたニコニコ動画コメントデータの声優トピック流行推移解析 by @Med_KU

  • データ
    • 800万の動画 300GB
    • 女性声優タグつき: 12万
    • コメント1000以上の動画を品詞分解: 10560の動画 56万品詞
  • 分析
    • 時系列別のトピック: コメントのNLP

ニコニコデータのタグネットワークを描画してみた by @ts_3156

  • Hadoop, Hive 仕事でやってます
  • 解析スクリプトは公開してます

野良リポジトリ

野良リポジトリ作ってみた

  • とりあえずリポジトリ作った
  • 文系, 理系とわず データ集めよう

ニコニコデータセットの分析環境を作ってみた by shibacow さん

  • AWS, Hadoop, Hive
    • EMR (EC2)
  • コメント情報に smid(ビデオID) を追加
  • S3 > Hadoop > Hive > JSON > 分析
    • m1-midium と m1-large
  • サンプリング(ランダム)
  • ニコニコデータビューアー作った
    • Nodejs
  • 分析を共有したかった
  • 誰でも簡単に分析できるように
  • 土日だけ公開。 AWS ¥5,000/月 ぐらい。

電車内でスマートフォン普及率の観察調査 2013 by tak さん

  • リアルデータの分析
  • 電車内でSmartPhone使用者を観察
    • 自分でTwitte

ボカロオリジナル曲における「良曲浮上」ランキングデータ by _Gissy さん

  • vocalonobis の中の人
  • 動画群の正規化
  • パラメータ調整
  • 良曲ポイント算出
  • 97500 曲
  • 前日推移でランキング
  • RSS配信始めました
    • 雑誌や他サイトと連携してます

リアルでRealなTwitterデータセット(ゆるふわ版) by tksakaki さん

  • twitter 分析
  • ソーシャルセンサー
  • イベント系データ
    • 天気, 地震
  • ユーザ系データ
    • 雨男雨女

三種のツイートデータ:収集と分析 by toritorix

  • 震災後Twitterデータ

    • データ収集 @PENGUINANA <= ここで名前を聞くとは
    • デマ情報の抽出
    • 根性マイニングw
      • 目視 : 精度は高い!!
  • 国内GEOデータ

    • StreamingAPI
    • 位置情報つきTweetの分布
    • 3大がっかりポイント 分析
      • がっかりtweet分析
        • 札幌時計台, はりまや橋, 守礼門
  • 選挙関連Tweet

LT

コメントが動画の特徴を示してい るか 調べてみました by 07c00 さん

  • Jubatas
  • コメントから動画の特徴抽出

ニコニコデータセットに扱われてみた by toriimiyukki さん

  • コメントから感情分析

NASA のデータセットで遊ぶ by ksasao さん

  • NASAのオープンデータ解析
  • 画像データがめちゃでかい (数GB): PSとか開けない
  • 世界でハッカソン開催: 参加しました
  • 天体画像から顔認識

Satoru Ogasawara さん

  • せどり やってみた実例データ

ハネコト さん

  • 分析構想の話
  • これからやってみたい. やりかた教えて

hitoyosh さん

  • コメントアノテーション

shrineroot さん

  • N次創作

伊予柑さん

  • 詐欺グラフ LT

Comments