當(dāng)下軟件園 / 匯聚當(dāng)下最新最酷的軟件下載站!
當(dāng)下軟件園

您的位置: 首頁(yè) > 網(wǎng)絡(luò)軟件 > 瀏覽輔助 > LocoySpider(火車(chē)采集器) V9.12 官方版

  LocoySpider是一款非常專(zhuān)業(yè)的數(shù)據(jù)采集軟件,該軟件功能強(qiáng)大,為廣大用戶(hù)提供了網(wǎng)絡(luò)數(shù)據(jù)采集以及信息挖掘等功能,有了它,我們可以通過(guò)靈活的方式輕松的從網(wǎng)頁(yè)上抓取文字、圖片、文件等任何數(shù)據(jù)。

  LocoySpider程序支持遠(yuǎn)程下載圖片文件,支持網(wǎng)站登陸后的信息獲取,支持探測(cè)文件真實(shí)地址,支持代理,支持防盜鏈的采集,支持采集數(shù)據(jù)直接入庫(kù)和模仿人手工發(fā)布等許多功能特點(diǎn)。

LocoySpider

【軟件特色】

  1、規(guī)則自定義 - 通過(guò)采集規(guī)則的定義,可以搜索所有網(wǎng)站采集幾乎任何類(lèi)型的信息。

  2、多任務(wù),多線(xiàn)程 - 可以同時(shí)進(jìn)行多個(gè)信息獲取任務(wù),每個(gè)任務(wù)可以使用多個(gè)線(xiàn)程。

  3、所見(jiàn)即所得 - 任務(wù)采集過(guò)程所見(jiàn)即所得,過(guò)程中遍歷的鏈接信息、采集信息、錯(cuò)誤信息等都會(huì)及時(shí)的反映在軟件界面中。

  4、數(shù)據(jù)保存 - 數(shù)據(jù)邊采集邊自動(dòng)保存到關(guān)系數(shù)據(jù)庫(kù)中,并且數(shù)據(jù)結(jié)構(gòu)能夠自動(dòng)適應(yīng),軟件可以根據(jù)采集規(guī)則自動(dòng)創(chuàng)建數(shù)據(jù)庫(kù),以及其中的表和字段,也可以通過(guò)導(dǎo)庫(kù)方式靈活的將數(shù)據(jù)保存到客戶(hù)已有的數(shù)據(jù)庫(kù)結(jié)構(gòu)中。

  5、斷點(diǎn)續(xù)采 - 信息收集任務(wù)可以在停止后從斷點(diǎn)開(kāi)始繼續(xù)采集,從此你用不再擔(dān)心你的采集任務(wù)意外中斷了。

  6、網(wǎng)站登錄 - 支持網(wǎng)站Cookie,支持網(wǎng)站可視化登錄,即使登錄時(shí)需要驗(yàn)證碼的網(wǎng)站也能采集。

  7、計(jì)劃任務(wù) - 通過(guò)這個(gè)功能可以讓你的采集任務(wù)定時(shí)、定量或者一直循環(huán)執(zhí)行。

  8、采集范圍限制 - 可以根據(jù)采集的深度和網(wǎng)址的標(biāo)識(shí)來(lái)限制采集的范圍。

  9、文件下載 - 可以將采集到的二進(jìn)制文件(諸如:圖片、音樂(lè)、軟件、文檔等等)下載到本地磁盤(pán)或者采集結(jié)果數(shù)據(jù)庫(kù)中。

  10、結(jié)果替換 - 可以將采集的結(jié)果根據(jù)規(guī)則替換成你定義的內(nèi)容。

  11、條件保存 - 可以根據(jù)某個(gè)條件來(lái)決定那些信息保存,那些信息過(guò)濾。

  12、過(guò)濾重復(fù)內(nèi)容 - 軟件可根據(jù)用戶(hù)設(shè)置和實(shí)際情況對(duì)重復(fù)內(nèi)容和重復(fù)網(wǎng)址自動(dòng)刪除重復(fù)內(nèi)容。

  13、特殊鏈接識(shí)別 - 運(yùn)用此功能可以將用JavaScript動(dòng)態(tài)生成的鏈接或其他更古怪的連接識(shí)別出來(lái)。

  14、數(shù)據(jù)發(fā)布 - 可以通過(guò)自定義接口,將已采集的結(jié)果數(shù)據(jù)發(fā)布到任意的內(nèi)容管理系統(tǒng)和指定數(shù)據(jù)庫(kù)中。現(xiàn)在已支持的目標(biāo)發(fā)布媒體包括:數(shù)據(jù)庫(kù)(access, sql server,my sql,oracle) ,靜態(tài)htm文件。

  15、預(yù)留編程接口 - 定義多個(gè)編程接口,用戶(hù)可以在事件中利用PHP,C#語(yǔ)言進(jìn)行編程,擴(kuò)充采集功能。

LocoySpider

【功能介紹】

  1、支持所有網(wǎng)站編碼:完美支持采集所有編碼格式的網(wǎng)頁(yè),程序還可以自動(dòng)識(shí)別網(wǎng)頁(yè)編碼。

  2、多種發(fā)布方式:LocoySpider支持目前所有主流和非主流的CMS,BBS等網(wǎng)站程序,通過(guò)系統(tǒng)的發(fā)布模塊能實(shí)現(xiàn)采集器和網(wǎng)站程序間的完美結(jié)合。

  3、全自動(dòng):無(wú)人值守工作,配置好程序后,程序?qū)⒁罁?jù)您的設(shè)置自動(dòng)運(yùn)行,完全無(wú)需人工干預(yù)。

  4、本地編輯:本地可視化編輯已采集的數(shù)據(jù)。

  5、采集測(cè)試:這是其它任何同類(lèi)采集軟件所不能比的,程序支持直接查看采集結(jié)果并測(cè)試發(fā)布。

  6、管理方便:使用站點(diǎn)+任務(wù)方式管理采集節(jié)點(diǎn),任務(wù)支持批量操作,再多的數(shù)據(jù)管理也很輕松。

【軟件功能】

  多線(xiàn)程高速并行采集系統(tǒng)

  任務(wù)分配至多個(gè)客戶(hù)端,同時(shí)運(yùn)行采集,效率倍增。

  多識(shí)別系統(tǒng)

  配備正文識(shí)別、中文分詞識(shí)別、任意編碼識(shí)別等多種識(shí)別系統(tǒng),智能識(shí)別操作更輕松。

  可選驗(yàn)證方式

  LocoySpider可選擇是否使用加密狗,隨時(shí)保障數(shù)據(jù)安全。

  全自動(dòng)運(yùn)行

  無(wú)需人工值守操作,任務(wù)完成后自動(dòng)關(guān)機(jī)。

  替換功能

  同義,近義詞替換、參數(shù)替換,偽原創(chuàng)必備技能。

  任意文件格式下載

  圖片、壓縮文件、視頻等任意格式的文件都能輕松下載。

  系統(tǒng)運(yùn)行監(jiān)控

  監(jiān)控?cái)?shù)據(jù)質(zhì)量,確保數(shù)據(jù)準(zhǔn)確性。

  支持多數(shù)據(jù)庫(kù)

  支持Access/MySQL/MsSQL/Sqlite/Oracle多種類(lèi)型的數(shù)據(jù)庫(kù)保存及發(fā)布。

  無(wú)限級(jí)多頁(yè)采集

  支持包含ajax請(qǐng)求數(shù)據(jù)在內(nèi)的多個(gè)頁(yè)面信息的無(wú)限級(jí)采集。

  支持?jǐn)U展

  LocoySpider支持接口和插件擴(kuò)展,滿(mǎn)足各種采發(fā)需求。

【解決方案】

  建網(wǎng)站苦于沒(méi)內(nèi)容?

  火車(chē)采集器可自動(dòng)采集優(yōu)質(zhì)內(nèi)容,定時(shí)發(fā)布;并配置多種數(shù)據(jù)處理選項(xiàng),讓網(wǎng)站內(nèi)容獨(dú)一無(wú)二,快速提升網(wǎng)站流量!

  業(yè)務(wù)發(fā)展遭遇瓶頸?

  火車(chē)采集器助您在數(shù)據(jù)中快速挖掘新客戶(hù);透視競(jìng)爭(zhēng)對(duì)手的業(yè)務(wù)數(shù)據(jù),分析客戶(hù)行為拓展新業(yè)務(wù),精準(zhǔn)營(yíng)銷(xiāo)降低風(fēng)險(xiǎn)和預(yù)算。

  數(shù)據(jù)提取速度太慢?

  火車(chē)采集器采用分布式高速采集系統(tǒng),多個(gè)服務(wù)端同時(shí)運(yùn)作,解決工作學(xué)習(xí)中大量的數(shù)據(jù)下載及使用需求,讓您能有更多時(shí)間做更多事。

  輿情監(jiān)測(cè)無(wú)從下手?

  火車(chē)采集器可應(yīng)用于“輿情雷達(dá)監(jiān)測(cè)與測(cè)控系統(tǒng)”,精準(zhǔn)監(jiān)控網(wǎng)絡(luò)數(shù)據(jù)的信息安全,及時(shí)對(duì)不利或危情信息進(jìn)行預(yù)警處理。

【新功能】

  1、 列表頁(yè)新增“地址處理”功能

  內(nèi)容替換/排重

  可以對(duì)網(wǎng)址中內(nèi)容進(jìn)行替換,且替換完成后,重復(fù)的網(wǎng)址會(huì)自動(dòng)去重。

  純正則替換

  可以使用正則表達(dá)式進(jìn)行匹配,和內(nèi)容替換功能類(lèi)似

  字符編碼處理

  網(wǎng)址中有需要轉(zhuǎn)碼的內(nèi)容,比如采到的鏈接里有 & 可以進(jìn)行解碼

  2、新增“請(qǐng)求失敗數(shù)”的預(yù)警條件設(shè)置

  3、下載圖片命名,新增[記錄自增Id]格式

  記錄自增ID:同一個(gè)內(nèi)容頁(yè)中,多個(gè)標(biāo)簽設(shè)置記錄自增ID,那么多個(gè)標(biāo)簽都是從1開(kāi)始自增,再次測(cè)試運(yùn)行又會(huì)重新開(kāi)始從1自增,更換個(gè)內(nèi)容頁(yè)測(cè)試運(yùn)行,也是從1開(kāi)始自增。

  自增ID:設(shè)置自增ID是采集器啟動(dòng)后運(yùn)行,開(kāi)始一個(gè)自增ID,從1開(kāi)始自增,之后就是自增。重啟采集器后,又會(huì)重新開(kāi)始自增ID,從1開(kāi)始自增。

  4、修復(fù)圖片下載誤判斷問(wèn)題

  5、修復(fù)計(jì)劃任務(wù)中“每天調(diào)度”,起始運(yùn)行時(shí)間配置未生效的問(wèn)題

  6、 修復(fù)PHP插件,對(duì)于循環(huán)記錄的處理報(bào)錯(cuò)的問(wèn)題

  7、修復(fù)拼音首字母對(duì)于一些錯(cuò)誤字符的判斷問(wèn)題

  8、任務(wù)批量編輯,修復(fù)“發(fā)布”中“多網(wǎng)站亂序發(fā)布”未能復(fù)制的問(wèn)題

  9、修改“循環(huán)添加新記錄”配置后,修復(fù)數(shù)據(jù)格式選擇錯(cuò)誤的問(wèn)題

  10、修復(fù)循環(huán)記錄中列表頁(yè)標(biāo)簽被多次處理的問(wèn)題

  11、修復(fù)對(duì)于一些302跳轉(zhuǎn)地址,無(wú)法正確跳轉(zhuǎn)的問(wèn)題

  12、修復(fù)一些網(wǎng)址無(wú)法正確請(qǐng)求的問(wèn)題

軟件特別說(shuō)明

標(biāo)簽: LocoySpider 火車(chē)采集器 數(shù)據(jù)采集 信息采集

其他版本下載
網(wǎng)友評(píng)論
回頂部 去下載

關(guān)于本站|下載幫助|下載聲明|軟件發(fā)布|聯(lián)系我們

Copyright ? 2005-2025 www.virtualinsta360.com.All rights reserved.

浙ICP備2024132706號(hào)-1 浙公網(wǎng)安備33038102330474號(hào)