什麼是Hotter or Notter 計畫
Hotter or Notter 研究計畫的目標是在建立起一套排名機制,以較少的投票次數,有效率且準確性高的排序大量的資料,得知每位參賽者的排名。 在Internet越來越風行的現今,這個問題越來越被重視,例如:現在有許多網路票選活動,想藉由網友的力量,票選如電影、音樂、甚至是美女或型男, 在這些排名比賽中,往往不但有幾千幾萬位參賽者,並且隨時可能有參賽者被移除或是加入,更重要的是,由於參賽者眾多,每位參賽者通常只會被少數投票者所投票, 因此如何用較少的投票次數,來得知所有參賽者排名就成為很重要的課題。
現行的許多排名系統,在解決這個排名問題時,有些使用打分數的方式來評斷照片(如:hotornot讓使用者給每張照片1~10分), 並以平均分數來排名。這樣的做法雖然簡單,但易受使用者打分數的基準影響,例如"好心"的使用者可能習慣打7~10分,然而"嚴格"的使用者可能習慣打3~5分的分數。 如此在投票票數不多的情況下,容易造成排名的誤差。 除此之外,某些系統中,使用兩兩比較的方式來投票,如此可以排除如打分數般的評斷者誤差。但是這些系統大多以平均勝率作為排序的手段,如此一來,贏了一位厲害的參賽者,與贏了一位弱小的參賽者,得到了同樣的加分,因此也很難在投票數很少的情況下得到很好的排名成果。 另外,在處理類似的問題中,還有一些系統,如: Elo、Glicko以及TrueSkill有很傑出的成果,前兩者是西洋棋手排名問題中有名的演算法,後者是微軟研究團隊研發的演算法,用於替線上遊戲的玩家排名,以求得最好的比賽配對。
在我們的系統中,我們預先選好需要互相比較的參賽者,這樣做的目的,一方面可以保持每位參賽者的比較次數大致相同, 另一方面可以保證所有照片都能有間接比較。經由投票者選出勝利者之後,我們利用修改過的 Bradley and Terry Model來進行排序,在這個演算法之中,我們假設每張照片都有一個能力值,而我們經由求解找尋最大值的數學問題,求出每位參賽者能力的最大機率分布,讓這些能力值與實際的投票結果有最佳對應,即能力值大的人在兩兩比較中較容易獲勝,反之則較難得到勝利。 預測每位參賽者能力值後,我們就可以經由排序這些能力值得到實際的名次列表。
目前我們的排名系統,每位參賽者只需比較平均七次,就得到與Hotornot幾千次分數投票差不多甚至更好的結果,也就是假設一個三萬張照片的票選活動,我們僅需二十一萬票,就能得到差不多的排名。目前我們仍就這套演算法的改進繼續研究。
News :
我們要與pixnet合作囉,現在開始有屬於台灣人的網路美女、型男票選大賽。
恭喜Hotter or Notter實驗網頁 收集到兩百萬張投票。
有趣的審美觀測試比賽,大家來試試自己的眼光吧!!
