微博智能排序的一些思考 |
| 發(fā)布時(shí)間: 2012/8/6 11:20:54 |
|
最近,新浪微博信息流默認(rèn)排序方式從一開(kāi)始的“按時(shí)間排序”更改為“智能排序”,其實(shí)智能排序這個(gè)功能早在6月18號(hào)就推出來(lái)了,只不過(guò)當(dāng)時(shí)沒(méi)有強(qiáng)制推送,并且入口不明顯,沒(méi)有引起大家重視,在最近新浪強(qiáng)制推送之后,引起了很多用戶(hù)的反感,各種猜測(cè)和吐槽也隨之而來(lái),有人覺(jué)得這是強(qiáng)奸了用戶(hù),有人覺(jué)得這是要商業(yè)化的前奏,甚至把這個(gè)問(wèn)題類(lèi)比于百度搜索的競(jìng)價(jià)排名。
極客公園不參與吐槽,也不會(huì)去爭(zhēng)執(zhí),僅就現(xiàn)象的問(wèn)題去挖掘一些本質(zhì),供讀者參考。 微博的信息梳理 微博的短板處理——信息過(guò)載 微博的智能排序,按照官方的說(shuō)法是可以根據(jù)關(guān)注、標(biāo)簽和微博內(nèi)容等相關(guān)信息,幫助用戶(hù)梳理微博內(nèi)容,對(duì)同類(lèi)微博進(jìn)行合并、對(duì)可能感興趣的微博內(nèi)容進(jìn)行優(yōu)先展示的排序功能。 先拋開(kāi)大家所懷疑的商業(yè)目的或者內(nèi)容的審查和其它,這至少說(shuō)明一個(gè)問(wèn)題,微博自己也已經(jīng)意識(shí)到了自己的內(nèi)容的重復(fù)性造成的信息過(guò)載,這是所有UGC網(wǎng)站的共同問(wèn)題,解決時(shí)間線無(wú)效信息過(guò)多造成的信息過(guò)載。 知乎上的知友提出了 Facebook 的參考樣本: 信息過(guò)載之后,選擇“數(shù)據(jù)算法”來(lái)“優(yōu)化”信息質(zhì)量,是web上常見(jiàn)的一種方式。Facebook著名的News Feeds開(kāi)創(chuàng)了NFO( News Feeds Optimization),也一直飽受非議。這背后的關(guān)鍵問(wèn)題是:到底什么樣的信息才是重要的?根據(jù)關(guān)系?根據(jù)算法?根據(jù)我的點(diǎn)擊? 通過(guò)算法來(lái)計(jì)算信息的重要性,是人類(lèi)典型的無(wú)知:我們知道的越多,我們?cè)綗o(wú)知。信息的重要性完全是人的直覺(jué)的感受,非常動(dòng)態(tài),無(wú)法計(jì)算。這或許也是人類(lèi)其實(shí)值得驕傲的地方。 智能排序表面上會(huì)打亂信息排序,但是我不覺(jué)得用戶(hù)會(huì)對(duì)此有明確的感知,畢竟信息太多,并且還是互相斷裂的,時(shí)間的秩序感并不是那么重要。 我不覺(jué)得新浪微博的智能排序有什么陰謀,這其實(shí)是業(yè)界常規(guī)的一種處理方式。 在功能上,微博在智能排序上做了改進(jìn),只是由于新浪的強(qiáng)推,才會(huì)讓用戶(hù)覺(jué)得反感,微博在新功能的推送和引導(dǎo)方面,還有很大的改進(jìn)空間。 時(shí)間線和信息流的整理的規(guī)則制定 對(duì)用戶(hù) Timeline 的梳理,把對(duì)用戶(hù)更有價(jià)值的內(nèi)容優(yōu)先展示,這個(gè)是對(duì)抗垃圾內(nèi)容獲取微博信息價(jià)值的一種好辦法,從出發(fā)點(diǎn)和優(yōu)化微博的媒體屬性來(lái)說(shuō)不見(jiàn)得是一件壞事,其實(shí)最大的爭(zhēng)議就是該由誰(shuí)來(lái)制定整理和排序的規(guī)則。 假如把微博比喻為郵箱,當(dāng)做你所有信息的收件箱,那么郵箱有一種情況,就是用戶(hù)通過(guò)設(shè)置不同的關(guān)鍵詞和規(guī)則將不同的郵件進(jìn)行了分類(lèi)整理,方便查找和處理郵件的內(nèi)容,這屬于用戶(hù)自定義規(guī)則,如果這項(xiàng)功能在微博上體現(xiàn),那就相當(dāng)于微博關(guān)注的分類(lèi)和制定過(guò)濾一些微博來(lái)源如“皮皮時(shí)光機(jī)”等源頭發(fā)出的微博。只不過(guò)相比郵箱來(lái)說(shuō)微博用戶(hù)不一定愿意花時(shí)間去設(shè)定那么精準(zhǔn)的規(guī)則和關(guān)鍵詞,更何況,微博的媒體屬性也決定了內(nèi)容的千變?nèi)f化和包羅萬(wàn)象,用戶(hù)沒(méi)有精力也不會(huì)花精力去制定和篩選有價(jià)值的信息。 郵箱還有一個(gè)功能就是智能過(guò)濾垃圾郵件,根據(jù)大多數(shù)用戶(hù)的舉報(bào)和關(guān)鍵詞以及郵件來(lái)源的掃描,一般的郵箱服務(wù)已經(jīng)提供了垃圾郵件的過(guò)濾功能,甚至能提供很高的判斷率,把垃圾郵件封殺在郵箱之外,另外,QQ 郵箱還有一個(gè)類(lèi)似于智能分組的功能——智能歸檔,在一定的時(shí)間積累過(guò)后會(huì)將你的某些郵件智能歸檔,并且,很多郵箱還提供了郵件的智能排序,將互動(dòng)和聯(lián)系較多的聯(lián)系人的郵件前面加上重要的標(biāo)識(shí),這在一定程度上也是對(duì)郵件內(nèi)容的整理,如果這個(gè)功能遷移到微博上,不就類(lèi)似與微博的智能排序嗎?只不過(guò)是展現(xiàn)方式的不同,算法和驅(qū)動(dòng)給用戶(hù)提供的,是有互動(dòng)或者內(nèi)容較為高質(zhì)量的,篩選掉的,是有重復(fù)性提供的內(nèi)容過(guò)載的信息,這至少?gòu)墓δ軐傩陨险f(shuō),是對(duì)用戶(hù)有利的,只是還沒(méi)有達(dá)到那么智能的程度,所以才會(huì)為用戶(hù)所詬病。 而在目前看來(lái),如果新浪來(lái)制定規(guī)則,對(duì)新浪來(lái)說(shuō)非常有利,不管是對(duì)于微博信息的監(jiān)管商業(yè)內(nèi)容的推送,好比百度搜索結(jié)果的競(jìng)價(jià)排名。而如果由用戶(hù)來(lái)制訂,在一定程度上用戶(hù)的關(guān)注分組已經(jīng)實(shí)現(xiàn)了這樣的功能,但是大部分用戶(hù)不會(huì)設(shè)置關(guān)鍵詞篩選或者排序機(jī)制來(lái)優(yōu)化自己的時(shí)間線內(nèi)容。 所以,這是一個(gè)功能型的硬需求,只不過(guò)微博在功能的完成上,還有很長(zhǎng)的路要走。當(dāng)然,這個(gè)問(wèn)題不僅僅是微博一家需要面對(duì)和考量的問(wèn)題,同類(lèi)網(wǎng)站甚至于社交類(lèi)屬性的網(wǎng)站都會(huì)面臨這樣的問(wèn)題,如果能有良好的技術(shù)解決類(lèi)似于時(shí)間線的相關(guān)性排序及搜索方面的問(wèn)題,將會(huì)出現(xiàn)一個(gè)類(lèi)似于當(dāng)年 Google PageRank 加權(quán)算法那樣革命性的技術(shù),以此來(lái)奠定 Web2.0 網(wǎng)站的高效使用及商業(yè)化基礎(chǔ)。這會(huì)是一個(gè)突破性的創(chuàng)新,當(dāng)然,在信息的質(zhì)量和時(shí)間線權(quán)衡上面,也要做出相應(yīng)的權(quán)衡。 本文出自:億恩科技【www.xuefeilisp.com】 服務(wù)器租用/服務(wù)器托管中國(guó)五強(qiáng)!虛擬主機(jī)域名注冊(cè)頂級(jí)提供商!15年品質(zhì)保障!--億恩科技[ENKJ.COM] |
京公網(wǎng)安備41019702002023號(hào)