后羿采集器官方版是提供網(wǎng)頁數(shù)據(jù)采集的應用工具,功能十分強大,界面設(shè)計也比較簡單。提供豐富的采集功能,可以只需輸入網(wǎng)址就能智能識別數(shù)據(jù),還支持多種數(shù)據(jù)導出方式,更支持全操作系統(tǒng),無縫切換,操作簡單又便捷。
后羿采集器是杭州快憶科技有限公司旗下的一款采集軟件,本產(chǎn)品由前谷歌搜索技術(shù)團隊基于人工智能技術(shù)研發(fā),功能強大,操作簡單,可謂是居家旅行隨身神器。
1、功能強大,提供企業(yè)級服務
后羿采集器提供豐富的采集功能,無論是采集穩(wěn)定性或是采集效率,都能夠滿足個人、團隊和企業(yè)級采集需求。
豐富的功能: 定時采集,自動導出,文件下載,加速引擎,按組啟動和導出,Webhook,RESTful API,智能識別SKU和大圖等。
2、智能識別數(shù)據(jù),小白神器
自動識別:列表、表格、鏈接、圖片、價格等
智能模式:基于人工智能算法,只需輸入網(wǎng)址就能智能識別列表數(shù)據(jù)、表格數(shù)據(jù)和分頁按鈕,不需要配置任何采集規(guī)則,一鍵采集。
3、可視化點擊,簡單上手
流程圖模式:只需根據(jù)軟件提示在頁面中進行點擊操作,完全符合人為瀏覽網(wǎng)頁的思維方式,簡單幾步即可生成復雜的采集規(guī)則,結(jié)合智能識別算法,任何網(wǎng)頁的數(shù)據(jù)都能輕松采集。
可模擬操作: 輸入文本、點擊、移動鼠標、下拉框、滾動頁面、等待加載、循環(huán)操作和判斷條件等。
4、云端賬號,方便快捷
創(chuàng)建后羿采集器賬號并登錄,您的所有采集任務設(shè)置都將自動加密保存到后羿的云端服務器,無需擔心采集任務丟失,任務運行及采集的數(shù)據(jù)均在您本地,而且非常安全,只有您自己在本地登錄客戶端后才能查看。后羿采集器對賬號沒有終端綁定限制,您切換終端時采集任務也會同步更新,任務管理方便快捷。
5、全平臺支持,無縫切換
同時支持Windows、Mac和Linux全操作系統(tǒng)的采集軟件,各平臺版本完全相同,無縫切換。
6、支持多種數(shù)據(jù)導出方式
采集結(jié)果可以導出到本地,支持TXT、excel、CSV和HTML文件格式,也可以直接發(fā)布到數(shù)據(jù)庫(mysql、MongoDB、sql server、PostgreSQL)供您使用。
1、在極光下載站下載后羿采集器安裝包并解壓,找到安裝程序雙擊安裝
2、閱讀并同意許可協(xié)議,點擊下一步
3、選擇安裝存儲位置,點擊安裝
4、等待安裝,安裝完成即可打開使用
步驟1:創(chuàng)建采集任務
1-啟動后羿采集器,進入主界面,點擊創(chuàng)建任務按鈕創(chuàng)建 &向?qū)Р杉蝿?
2-輸入百度搜索的URL,包括三種方式
1、手動輸入:在輸入框中直接輸入URL,多個URL時須要換行分割
2、點擊從文件中讀取方式:用戶選擇一個存放URL的文件,文件中可以有多個URL地址,地址須要換行分割。
3、批量添加方式:通過添加并調(diào)整地址參數(shù)生成多個有規(guī)律的地址
步驟2:定制采集過程
1-點擊創(chuàng)建后自動打開第一個URL進而進入向?qū)гO(shè)置,此處選擇列表頁,點擊下一步
2-填寫搜索關(guān)鍵字和選擇輸入關(guān)鍵字的輸入框,點擊下一步。進入第一個關(guān)鍵字搜索結(jié)果頁面后,點擊設(shè)置搜索按鈕,點擊下一步
3-點選列表塊中第一塊元素。再點擊結(jié)果列表塊中另外一塊元素,此時自動選中列表塊。點擊下一步
4-選擇下一頁按鈕,選中選擇下一頁選項,然后點擊頁面中的下一頁按鈕填充第一個輸入框,第二個數(shù)據(jù)框可以調(diào)節(jié)采集運行中點擊下一頁按鈕的次數(shù)。理論上次數(shù)越多,采集到的數(shù)據(jù)越多。點擊下一步
5-選擇要采集的字段:在焦點框中點選要抽取的元素后點擊下一步。選擇不進入詳情頁。點擊保存或保存并運行
步驟3:數(shù)據(jù)采集及導出
1-采集任務運行中。采集完成后,選擇“導出數(shù)據(jù)”可以把數(shù)據(jù)都導出到本地文件
2-選擇“導出方式”,將采集好的數(shù)據(jù)導出,這里可以選擇excel作為導出為格式
3-采集數(shù)據(jù)導出
網(wǎng)友評論