網(wǎng)絡(luò)文學頻遭“秒盜” 文學網(wǎng)站升級防盜新技術(shù)
作 者:任曉寧 來 源:中國新聞出版廣電報發(fā)表日期:2018-03-08
閱文集團上線了特殊算法模型數(shù)據(jù)庫,已實現(xiàn)快速查詢底層能力,秒級內(nèi)實時計算出指定章節(jié)內(nèi)容重復(fù)度,為防抄襲提供大數(shù)據(jù)基礎(chǔ)能力。
晉江文學城設(shè)計了一套抄襲舉報管理系統(tǒng),自系統(tǒng)上線以來,已累計受理用戶舉報抄襲文章4000余次,共成功處理抄襲文章2000余篇。
分級自動化內(nèi)容防盜系統(tǒng)是根據(jù)對盜文者行為模式的分析,制定對應(yīng)的防盜規(guī)則,付費章節(jié)作者可以設(shè)定對某些特定人群在一定時間內(nèi)投放干擾性閱讀內(nèi)容,從而起到一定的防盜作用。
盜版、抄襲現(xiàn)象是阻礙網(wǎng)絡(luò)文學發(fā)展的沉疴。據(jù)不完全統(tǒng)計,每年網(wǎng)絡(luò)文學行業(yè)因盜版損失接近100億元。近一段時間以來,閱文集團、晉江文學城等紛紛升級防盜版措施,把大數(shù)據(jù)、云計算等互聯(lián)網(wǎng)新興技術(shù)應(yīng)用到防盜版、防抄襲上,技術(shù)手段有了進展。
《中國新聞出版廣電報》記者了解到,閱文集團針對抄襲行為上線了特殊算法模型數(shù)據(jù)庫,實時查重作家上傳的作品內(nèi)容。晉江文學城通過技術(shù)手段,付費章節(jié)作者可以設(shè)定對特定人群在一定時間內(nèi)投放干擾內(nèi)容,起到了一定的防盜版作用。
特殊算法
實現(xiàn)網(wǎng)絡(luò)文學秒級查重
“去年,我們基于自己的數(shù)據(jù)庫開發(fā)了一整套特殊算法模型數(shù)據(jù)庫,在編輯后臺可以直觀地比對作者的文本是否有抄襲,雖然增加了服務(wù)器壓力,但是我覺得很值得。”閱文集團旗下起點中文網(wǎng)總編輯李曉亮這樣告訴記者。
當前,這套針對抄襲行為上線的特殊算法模型數(shù)據(jù)庫已經(jīng)在整個閱文集團平臺應(yīng)用,在這個系統(tǒng)支持下,編輯可以實時查重作者上傳的作品內(nèi)容。作者每發(fā)一章,平臺就可以自動對比全網(wǎng)書庫,提醒編輯本章與書庫中內(nèi)容的重復(fù)率,以便人工查驗是否抄襲,當重復(fù)率超過50%時,平臺就會自動報警,該做法有效解決了抄襲現(xiàn)象。
“如果抄襲嚴重,我們會直接禁了作者權(quán)限。”李曉亮說。
據(jù)了解,目前閱文集團已實現(xiàn)快速查詢底層能力,秒級內(nèi)實時計算出指定章節(jié)內(nèi)容重復(fù)度。這種特殊算法模型根據(jù)有效命中段落數(shù)、作品總有效段落數(shù)加權(quán)計算單章節(jié)重復(fù)度,并根據(jù)單章節(jié)重復(fù)度計算作品總重復(fù)度。為了建立最專業(yè)的防抄襲監(jiān)控體系,閱文集團通過歷年深耕,已積累千萬級的作品基礎(chǔ)數(shù)據(jù),有效章節(jié)數(shù)達1.5億,有效段落數(shù)達數(shù)百億,為防抄襲提供大數(shù)據(jù)基礎(chǔ)能力。
對于效果,李曉亮表示滿意,“這個措施還是有用的,每章剛一出現(xiàn),就能發(fā)現(xiàn)是否有抄襲嫌疑了。”他認為,這個功能可以降低內(nèi)容監(jiān)管風險、提高人工審核效率。
舉報管理系統(tǒng)
警示抄襲行為
對于抄襲,晉江文學城在業(yè)內(nèi)一直是態(tài)度鮮明的持續(xù)打擊,無論是小透明還是網(wǎng)絡(luò)大神,凡是有確鑿證據(jù),一律按照相關(guān)規(guī)定處理。記者了解到,晉江文學城目前設(shè)計了一套抄襲舉報管理系統(tǒng),自系統(tǒng)上線以來,已累計受理用戶舉報抄襲文章4000余次,共成功處理抄襲文章2000余篇。
晉江文學城的抄襲舉報管理系統(tǒng)主要有“用戶前臺舉報”端及“管理員后臺處理”端兩大部分,同時為便于后續(xù)處理,又將舉報抄襲分為“全文照搬”“文字抄襲”“劇情抄襲”三大類。
對于用戶提供的抄襲證據(jù),系統(tǒng)會根據(jù)文章數(shù)據(jù)庫再次進行核實,尤其是在文字抄襲和全文照搬的處理上,基于晉江文學城判定標準,系統(tǒng)會將抄襲文章和被抄襲文章的雷同語段進行特殊標識,并進行雷同語段統(tǒng)計,減少人工判斷的難度。針對劇情抄襲,系統(tǒng)會將抄襲對應(yīng)章節(jié)進行箭頭指向引導(dǎo)展示,便于處理者能夠更加明確地查看到對應(yīng)關(guān)系。
對于被判定了抄襲的文章,晉江文學城會做出對應(yīng)的懲罰措施,舉報者也會得到舉報成功的獎勵,以此來激勵更多的用戶加入到反抄襲、維護原創(chuàng)作者權(quán)益的隊伍中,同時也對作者們起到一定的警示作用,保持晉江文學城這一片創(chuàng)作凈土。
內(nèi)容防盜系統(tǒng)
初步實現(xiàn)防盜目的
2017年度,晉江法務(wù)部聯(lián)合熱心作者、讀者做了大量的反盜版維權(quán)工作,為作者追回近千萬元的經(jīng)濟損失,并將兩家公司納入失信被執(zhí)行人名單進行信用懲戒。在技術(shù)手段上,晉江也上線了分級自動化內(nèi)容防盜系統(tǒng)和盜文侵權(quán)行為通知函件自動發(fā)送系統(tǒng)。
分級自動化內(nèi)容防盜系統(tǒng)是根據(jù)對盜文者行為模式的分析,制定對應(yīng)的防盜規(guī)則,付費章節(jié)作者可以設(shè)定對某些特定人群在一定時間內(nèi)投放干擾性閱讀內(nèi)容,比如24—72小時內(nèi),只有購買一定比例的VIP讀者才能看到最新內(nèi)容,否則只能看到之前的舊內(nèi)容,從而起到一定的防盜作用。盜文侵權(quán)行為通知函件自動發(fā)送系統(tǒng)是讓作者通過該系統(tǒng)向指定侵權(quán)網(wǎng)站聯(lián)絡(luò)郵箱發(fā)送侵權(quán)通知函件,要求將侵權(quán)作品進行下架刪除等處置,同時系統(tǒng)會記錄并分析相應(yīng)數(shù)據(jù),便于網(wǎng)站法務(wù)部門人員查看,達到一定程度后,會有法務(wù)人員人工介入處理。
2017年,晉江文學城多次就抄襲、盜版問題發(fā)起過訴訟,大部分案件獲得較好的維權(quán)結(jié)果。比如百度閱讀侵犯晉江作者玖月晞的《親愛的阿基米德》《一座城,在等你》作品著作權(quán)案,目前已經(jīng)獲得一審判決,其維權(quán)行為得到法院認可。
“在反盜版上,我們也一直致力于在盡量不影響絕大多數(shù)正常讀者用戶體驗的基礎(chǔ)上,提升網(wǎng)站各種防盜手段。但上述技術(shù)手段只能起到部分作用,在此基礎(chǔ)上,我網(wǎng)站法務(wù)人員也付出了很大努力。”晉江文學城副總裁劉旭東認為,網(wǎng)絡(luò)文學的抄襲、盜版問題一直比較嚴重,也是制約行業(yè)健康發(fā)展、侵害作者和文學網(wǎng)站權(quán)益的最重要問題之一。抄襲問題更多的是一種道德品質(zhì)層面的問題,需要作者自覺自律,需要網(wǎng)站公平公正的處理。而盜版問題,危害重,維權(quán)難,一直深受詬病,但鑒于網(wǎng)絡(luò)文學這種線上閱讀的模式,除非不讓讀者閱讀,否則以現(xiàn)有技術(shù)水平來說,很難徹底根除盜版現(xiàn)象,畢竟還有“手打團”這種盜版方式的存在,因此各級網(wǎng)站、各位作者也只是盡可能地增加盜版難度,降低侵害。
起點中文網(wǎng)則主要通過禁止復(fù)制作品內(nèi)容,以及停權(quán)盜帖賬號這兩個辦法來反盜版,盡管也取得不小的反盜版成果,李曉亮對此依然提出困惑,“只要盜版網(wǎng)站投入的成本達到一個很低的門檻,我們基本就無能為力了。”他認為,這也是當前正版文學網(wǎng)站一段時間內(nèi)持續(xù)面臨的困境。
- 相關(guān)文章
-