だらけ日記過去ログ:2004年11月7日(日)「今日の作業」
入力:25サイト、未処理メール:1、総入力サイト数:140。 朝起きたらいっぱいきてた。 んで、しなきゃいいのに感想系リンクメンテ。「動向様子見中」を作ってその辺分離。新規サイトもいくつかあるけど、今さらメールは出さない方向で。 あと、新規表として、この番組1を見ている人がこの番組2を見ている確率表を作ってみた。とりあえず現状のデータでテスト。んー、数字がいっぱい…。おもしろいデータが引き出せるかは結構微妙かも。でもよくよく見ると「SDGFを見ている人はアムドラも見ている傾向がある」とか「下級生2を見ている人はレジェンズはあまり見てない」とかぐらいはわかる様子。下位ランクが100%になりがちなので、ある程度サイト数が出ている番組でしか試せないなぁ。 サイト数だけの計算なので感想率は含まれていません。つか元データが感想率なので、感想は書いてないけど実は見ているデータは含まれません。…継続率の方からデータ採ればできるんだけど、まぁ今回はいいや。 計算は、 まず参加サイトリストを縦に、番組名を横に持つ表を作成>そのサイトがその番組の感想を書いていたらセルに1と表示>サイト-番組 の表が完成>別シートに 縦 番組名−横 番組名 の対戦表みたいのを作成>SUMIF関数で、番組Aの列に1と書かれた行における、番組Bのセル合計を求める>番組Aと番組Bの両方を見ているサイト数が表示される>番組−番組の同時視聴数表が完成(線対称の表になる)>その番組の視聴数で割って、パーセンテージを出す表を別シートに作る>完成 という流れ。感想があれば「1」と表示させるところがミソ。まぁそこを「1」じゃなくて感想率にしておけば、そこも反映した表になるけど、あんまり意味がないので「1」固定でいいかと。ついでにSUMIFの条件を「1」ではなく「0より上」にしなきゃいけなくなるな。 表の性質上、激しく横長になるのはどうすればいいのか…。