今年七月,起點中文網進行了建站以來最大的新書推薦算法改革,免費期新書從固定推薦位的四輪“PK模式”改為個性化推薦展示的“流量包模式”。這一改革在作者中引起極大反響和廣泛討論,由此也引出一系列關鍵卻缺乏討論的問題:什么是網文的推薦算法?推薦模式的變化為何如此重要?PK模式是什么?流量包模式又是什么?
推薦算法在網文中的應用,實現了海量內容與讀者的精準連接,也有效解決了長尾網文的分發與供給。免費平臺番茄小說如今日活躍用戶近億,遠超付費閱讀平臺,根本就在于以推薦算法為核心內容的分發模式。因此,原以編輯、運營為主導的,以分發精選為內容組織邏輯的老牌網文平臺,也紛紛推出個性化推薦功能。
與短視頻等平臺的內容推薦系統一樣,網文平臺的推薦系統也主要由數據層、算法層和工程層組成。數據層主要分析用戶、網文以及用戶與網文的交互數據和特征,如用戶性別、網文類型、閱讀時長等數據。算法層負責從數據中挖掘規律,生成推薦結果。網文平臺使用較多的兩種推薦算法是基于內容的推薦和協同過濾。基于內容的推薦依賴對網文本身特征的分析,通過賦予內容的類型與標簽,結合讀者的偏好信息,推薦與讀者興趣相近的網文。例如,歷史數據發現讀者喜歡看規則怪談類型的網文,算法就將更多和規則怪談相關的網文推薦給讀者。協同過濾推薦算法則不解析內容本身,主要依賴讀者與網文的交互數據,可分為基于讀者的和基于網文的。基于讀者的協同過濾是找到和讀者A相似的讀者B,給讀者A推薦讀者B看過但是讀者A沒看過的網文。基于網文的協同過濾則是找到觀看兩個不同網文的用戶群體,通過分析兩個讀者群體的重合度,推算兩篇網文的相似度,相似度高則進行合并推薦。一般推薦系統都會混合以上的算法,根據用戶操作行為選擇不同的推薦策略,無操作時用熱門默認推薦,少量操作時用基于內容的推薦,交互足夠多時用協同過濾推薦。工程層則是對上述數據和推薦的處理、排序、評估與優化。