您現在的位置是:芭奇站群管理系統 > 軟件使用教程大全 > -> 芭奇排除庫-設置排除不想采的目標站

芭奇排除庫-設置排除不想采的目標站

時間:2020-10-16 20:43

 

軟件問題描述:

最近發現有些用戶采集,會出現下面圖片的內容,經排查,是因為某些站用了一些黑帽手法,故意將標題和內容轉在亂碼之類的文章,用芭奇的關健字采集功能會采到這些站的原文內容:

圖片.png

圖片.png


解決方法具體如下,用芭奇站群的排除庫,排除以下網址(目前收集的可以不采的地址)

sh.qihoo.com

sina.com.cn

360kuai.com

kuaibao.qq.com

top.sogou.com
fankui.help.sogou.com
scholar.sogou.com
e.weibo.com/sogou
fankui.help.sogou.com
help.sogou.com
dangjian.sogou.com
snapshot.sogoucdn.com
www.baidu.com/search
www.baidu.com/more
wenku.baidu.com/search
bzclk.baidu.com
j.br.baidu.com
cache.baiducontent.com
cache.baidu.com
help.baidu.com
www.sohu.com
cqnews.net
southcn.com
cngold.org
kooxue.cn
mbachina.com
kesolar.com


注意:底下有教程2,設置排除庫教程

 

 

如果采集新浪圖庫文章時,會出現下面這樣文章,也可以考慮加入排除庫不采新浪圖庫的文章

 

圖片.png

 還有一些內容,可能是采到搜索的一些文章,如搜狗類的,這種可以加入敏感詞庫來實現排除。

圖片.png


 

 

 

 1、加敏感詞庫的方法:


圖片.png

圖片.png


==============以下是要加入敏感詞===============
百度百科
百度貼吧
全球最大的中文社區
百度知道
全球最大中文互動問答平臺
百度貼吧
百度文庫
搜狐視頻
百度知道搜索
百度漢語
百度學術
百度圖片
發現多彩世界
百度產品大全
百度一下
你就知道
搜狗產品大全
黨建搜索
搜狗學術
百度安全驗證
百科詞條人人可編輯
詞條創建和修改均免費
絕不存在官方及代理商付費代編
請勿上當受騙
百度一下,你就知道
百度信譽
404頁
搜狐視頻
QQ音樂
搜狗搜索快照
百度圖片搜索
百度履歷
搜狗-免責聲明
搜狗搜索幫助中心
搜狗熱搜榜
- 搜狗搜索
搜狗搜索
隱私政策
-搜狗公司





 

2、加排除庫的方法:

 

進入歸屬窗口,點開排除庫


圖片.png

 


圖片.png


 

 圖片.png

 

保存之后,就有一個排除庫。然后在左邊加載網站,勾上這個排除庫關聯所有站


圖片.png




 

另外提示:

想查看一些不想采的文章的地址的方法是,右健網站,在數據管理,點一個欄目,點右上角的已發布或未發布,,找到你認為不想采的文章標題,點“編輯”,左邊有一個“來源地址”,里面就有這個文章的來源,復制它有主域名,加在上面的排除庫。因為會不停有不同的站有這些文章,所以需要用戶自己收集

 

 圖片.png

 


极品美女自卫慰流水视频