だらけ日記過去ログ:2003年5月6日(火)「レア指数」
今日はどうやら朝にきたやつだけみたい。そろそろ終わりかしら、あとは〆切間近に何件か来るのかな。現在63サイト。 レア感想サイト指数をどう出すかについて、つるさんよりメッセージを頂きました。Mes:例えばなんですが、1作品ごとに感想書いてるサイト数で割ってみて(5サイトだったら0.2ですよね)一番低かったポイントを基準に(0.01が一番低かった場合、0.01を1ポイント、0.5で50ポイントという風に)足していって、なおかつそのサイトの感想を書いている数で割れば、そのサイトの通好み指数(なんじゃそりゃ)が出ると思うですよ。どでしょ? えと、つまり、作品ごとのレア度ポイントを出して、サイトごとにそのポイントを足した上で、サイトの持つ感想数で割ることによりサイトの平均レア指数を出そう、ということですな。 例を挙げると、トップの1番組だけ見ていた場合、トップのレア指数は「1」になるので、レア指数1÷取扱い感想数1=1 これが最低数値になりますね。 せっかくなのでちょっと現状のデータで計算…。うちのレア指数は5.39、つるさんとこで7.80となりました。ふたりともレア派なので違いが微妙なので参考資料として、放蕩オペラハウスさんのレア指数など上げてみますと、1.54になってます。1に近いほどメジャー作品を見る傾向ってことですね。 一見良さそうですが、問題点がふたつ。その1、自動化する関数が微妙に見えてこない…。 今のExcelファイルは、まだサイトごとのデータを引っ張れていません。どういう風にそれぞれのサイトの取り扱い番組に集計データを戻すかで、ちょっと考えている状態です。まぁたぶんなんとかなるとは思うのですが。あとその2との絡みがあるので、どのデータを拾うべきかも悩みどころです。その2、感想を書く確率のある作品をどう扱うか つまりタイトルの後ろに分数を付けていただいた「毎週取り扱うわけではない作品」のことです。毎週必ず感想を書く人には意外かもしれませんが、かなりの方が分数付きのデータを送ってくれました。この「分数」の扱いが微妙なんです。 例えば、レアポイントに感想比率をかけたものを使用した場合、1位の作品のみを2週に一度の割合で見ていたとすると、レア指数は1×(1/2)となり、0.5とあってはならないものになってしまいます。逆にレア度50の番組を1/2の確率で感想を書いていたとすると、レア指数25…、これはいいのか。 つまるところ「分数データの入れどころがわからない」といったところ。レア度50の作品を1/50の確率で感想を書かれたとして、それは本当にレア指数にくんでいいのか、そもそもレア指数を出す上の「サイト数」にその分数データは反映させなくていいのか、とか。 ちなみに感想率データにはちゃんと分数は反映させています。2サイトのデータがあったとして、同じ番組に対して1と1/2の分数データがあったとすると、感想率は {1+(1/2)}÷2 = 75[%] ですね。 ちょっと脱線したけど、レア指数を出すのはそう簡単にはいかないような感じ、ってことで。 いやまてよ…、分数を2回使えばいいのか…? SUM(レアポイント×取り扱い率(分数))÷分数を反映させた取り扱い番組数 こう。 1位の作品を1/2の確率で取り扱っていた場合、 { 1×(1/2)}÷{ 1×(1/2)} = 1 レア度50ポイントの作品を1/20と、レア度1ポイントの作品を毎週見ていた場合、 {{50×(1/20)} + { 1×(1/1)}}÷{ { 1×(1/20)} + { 1×(1/1)}} = 3.33 なんかあってそうな数字が出てきましたヨ。 レアポイント算出法はいまいちまだ不鮮明ですが。分数付きの方がいいのかなぁ。