(Pic from: ewp.rpi.edu)談到盜文這件事,相信都是群情憤慨,就如同「網站被 7headlines 框架」事件一樣,誰都不喜歡著作權被消費或竊取。
網路上的盜文應該可分成兩個層次,一種是完整的複製貼上,另一種是內容重整(部份心得、部份複製)。不曉得讀者覺得哪一種比較無法忍受呢?
以 WFU 而言,若被盜文的話,比較討厭的是內容重整那一種。以下會敘述理由,及各種自保與反制的方法。
一、層次1: 複製貼上
1. 自保技巧
過去曾寫過一系列「保護著作權」的文章,如果使用了以下的技巧:
- 文章內多使用自己文章的連結
- 文章某些用到 "我" 的時機,替換為 "WFU"
- 使用隱藏字串
相信這樣的文章,就算被複製貼上,讀者還是能夠知道該篇文章真正的出處為何。
如果想了解其他的自保技巧,可參考「如何用語法保護網頁文章著作權__(二)阻止全文轉載」系列文。
2. 複製貼上的動機
有的人複製貼上是真的在盜文,只是他不知道這是比較容易被抓到的途徑。不過或許有的人複製貼上,只是為了備份的目的,放在自己的部落格方便將來查詢。
例如本站這篇「讓 Google 試算表能自動回信__FormEmailer 設定」,發現「這篇複製內容」的圖文一字不差。反正連圖片浮水印都看得出來源為何,WFU 乾脆睜一隻眼閉一隻眼,省下追訴的時間與力氣。
3. 保留追訴的權力
雖然上述例子 WFU 尚未追究,但不代表複製貼上是可取的行為,因為根據本站下方宣告的 "CC 條款"(以及導覽列的 "版權聲明"),轉貼是需要 "姓名標示" 及附上出處連結的,因此視情況 WFU 有可能追究,萬一該篇盜文的搜尋結果很前面的話。
而且這還是比較寬鬆的 CC 條款,另一派主張使用「著作權」的站長,可用更嚴格的條件對付轉貼者,請參考 +Almighty Demiurge 這個「Blogger中文社群討論串」
二、Google 能否判定重複內容?
雖說 WFU 比較不擔心文章被完整地複製貼上,但這是因為本站文章偏 "資訊類型",利於使用前述的「自保技巧」來保護文章。如果是其他旅遊、美食、攝影類的文章,也許不是完全適用。
而且,還有一個嚴重的問題,Google 搜尋引擎怎麼知道是 WFU 複製別人的文章,還是別人複製我們的文章?
1. 原創性標記 Google Authorship
因此,取得一篇文章的「作者認證」是極為重要的事情,當 Google 認定你是該篇文章的原創作者後,文章的搜尋結果會出現大頭照,而其他一樣的複製內容當然就是抄襲啦,會很難出現在 google 搜尋引擎。
2014.7.15 更新:現在 Google 搜尋結果已經取消作者的大頭照,但「作者認證」仍然存在,詳細說明請見「搜尋結果不再顯示作者頭像!Google 為何要這麼做?」
申請原創文章標記的 Google Authorship,可參考這系列的流程「讓作者頭像出現在搜尋結果__申請Google Authorship心得」。
2. 仰賴第三方社群媒介
沒有申請原創性標記怎麼辦?Google 會怎麼判別重複的網頁呢?如果是規模較小的草創網站,這一點的確比較麻煩,因為 Google 收錄的速度慢,說不定盜文者的網頁還比原創者搶先收錄。
這篇「Stolen Content問題,文章被盜用怎麼辦?」提出的作法可供參考,發文後請第一時間分享到社群媒介(Google+ 或 Facebook),因為:
- 部落格發文時間能夠竄改
- 社群網站貼文時間無法變更為更早的時間
因此藉由第三方社群網站,可以輔助判斷誰才是原創者。
3. 自動同步貼文
要如何實現第一時間貼文到社群網站?以 Blogger 為例,可以這麼做:
- 同步到 G+:Blogger 後台 → Google+ → 張貼文章後自動分享
- 同步到 FB:使用 IFTTT → 設定 recipe → Blogger 同步到 FB
若 IFTTT 不清楚怎麼操作的話,可參考 Phil Ko 這篇「Blogger發文自動分享到Facebook」
三、層次2: 內容重整
內容重整是 WFU 比較頭痛的抄襲方式,因為此類盜文者願意花時間把隱藏字串去除、把連結及特定字串去除,一部份內容保持一樣,一部份內容改用自己的話說。
講白了他們就是要偷我們的構想,但不想給我們 Credit,又要裝成自己是原創。其實,這一類的剽竊者很多,不只存在於網路上,網路外的實體書籍很多都是這麼做,+Pan Kuan 在 Blogger 中文社群提供了「這個案例」可供參考。
對於「內容重整」式的剽竊作者,不容易抓到,但只能說,不是不報、時候未到。就像論文抄襲沒有標示出處,多年之後被抓包時,爬的位置越高,屆時只是摔得越重。(論文被踢爆涉抄襲 6日部長 楊念祖閃辭、涉論文詐審醜聞 蔣偉寧下台)
四、處置盜文的流程
當發現盜文者後,如何處置也許要依照情節輕重而定,以下整理一些可當成 SOP 的流程作為參考:
1. 走法律途徑
如果認為符合以下條件:
- 權益受損很大
- 需要走求償路線
- 有時間
- 有經費
那麼可參考這篇「被盜圖盜文侵害智慧財產權怎麼辦?有免費法律諮詢嗎?」,步驟列的滿詳細的,留言也有一些求償成功的案例。
2. 網路處理 SOP
如果屬於寫文章都來不及,沒有美國時間跟對方耗的站長,那麼可以在網路上直接將抄襲事件處理掉,可參考上一篇「處理盜文簡易 SOP 流程」,以下只摘要重點:
- 保存證據:避免對方網頁可隨時更改。
- 向搜尋引擎檢舉:使抄襲文章無法出現在搜尋結果。
- 向發文平台檢舉:向部落格平台、論壇檢舉,讓文章下架。
- 向主機商或域名商檢舉:成功的話,這個網域就被拔除了。
3. 是否需要知會抄襲者?
會不會覺得網路 SOP 有點少?許多站長還會好心地去函對方,請求將抄襲圖文下架。WFU 認為,對方抄襲前也沒想過要知會我們,而寫文章的時間都不夠了,實在沒多餘時間跟一位抄襲者魚雁往返!
當然,凡事都有例外,如果讀者在抄襲者的網站,看到作者的大頭貼是位大眼無辜美少女(男),那麼合理的推斷應該是這位妹妹(弟弟)涉世未深,不清楚要善盡先行知會才能轉貼的義務,才會不小心犯了這個錯,因此去個函 "溝通" 一下是非常合理的。
如果不是以上情境的話,建議省下這個時間,直接向 Google 及發文平台開鍘吧!
五、Blogger 平台檢舉流程實例
關於檢舉的實例,盜文平台在 Blogger 的話可參考這篇「Blogger 檢舉盜文流程」,若在其他平台請 Google 一下聯繫的窗口了。
需要特別提的一點為,在實務的操作上,如果希望盜文者的網站能被搜尋引擎處罰,降低該網站的信任度及權重,那麼建議先跟搜尋引擎檢舉,等搜尋引擎處理完後,再向盜文平台進行檢舉。
WFU 之前就是 "發文平台與搜尋引擎同時提出檢舉",結果發生 Blogger 平台先將文章下架,之後 Google 搜尋引擎要處理檢舉案子時,卻找不到盜文網頁這樣的結果。
六、如何知道被盜文?
如果是英語系的文章,國外有提供監測盜文的服務。然而,Unicode 系(含中文)的文章,目前要能偵測出盜文,只能我們作者自己 "勤奮" 一點、或是有報馬仔幫忙回報,才有可能得知。以下提供一些方法供參考:
1. 這篇「揪出抄襲者的幾個方法」 提供的方法有:
- 以圖搜圖
- 用 Google Alert 訂閱文章標題
- 文章剽竊檢測工具 Turnitin → 須自行上傳文章才能幫忙偵測
2. +Pan Kuan 在這個「Blogger中文社群討論串」使用的方法為,在文末插入個人常用語,定期用 google 搜尋此常用語,藉此發現是否有盜文者。
3. WFU 個人常用的作法為,利用「histats」→ Referring Sites 功能──
除了可看看讀者從哪些網站連過來,偶爾不小心就是靠這個功能抓到盜文者!更多使用技巧請參考「Histats 計數器操作心得」。
七、小結
雖說以上提供了不少抓盜文者的方法,然而都是必須 "勤勞"、"持之以恆",才能長久見效;只要一偷懶,必定讓僥倖者得利。
WFU 在想,如果能有個簡單、操作方便的方法,可 "自動" 揪出盜文者,那就再好不過。下一篇將會提出這個構想,希望能遏制短視近利的剽竊心態。
處理盜文相關文章:
Dear Wayne Fu:
回覆刪除您的這篇文章寫的清晰明瞭。感謝您花那麽多時間來爲受到困擾的人們解決難題。您是一位了不起的網站醫生。 祝福
虞和芳,31.10.17.
我在你的pixnet上看到這篇:http://wfublog.pixnet.net/blog/post/261134413-blogger-%E6%AA%A2%E8%88%89%E7%9B%9C%E6%96%87%E6%B5%81%E7%A8%8B%E5%AF%A6%E9%8C%84。如果我要幫別人檢舉內容農場的話有用嗎?比如大陸的軒轅劍玩家的攻略被台灣的內容農場盜用,而他翻不了牆去檢舉,那我有辦法法幫他嗎?
回覆刪除THX
刪除