HOME 首頁
SERVICE 服務產(chǎn)品
XINMEITI 新媒體代運營
CASE 服務案例
NEWS 熱點資訊
ABOUT 關于我們
CONTACT 聯(lián)系我們
創(chuàng)意嶺
讓品牌有溫度、有情感
專注品牌策劃15年

    火車頭插件怎么采集(火車頭插件怎么采集的)

    發(fā)布時間:2023-05-24 23:13:37     稿源: 創(chuàng)意嶺    閱讀: 54        

    大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關于火車頭插件怎么采集的問題,以下是小編對此問題的歸納整理,讓我們一起來看看吧。CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    開始之前先推薦一個非常厲害的Ai人工智能工具,一鍵生成原創(chuàng)文章、方案、文案、工作計劃、工作報告、論文、代碼、作文、做題和對話答疑等等CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    只需要輸入關鍵詞,就能返回你想要的內(nèi)容,有小程序、在線網(wǎng)頁版、PC客戶端和批量生成器CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    官網(wǎng):https://ai.de1919.comCnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    本文目錄:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭插件怎么采集(火車頭插件怎么采集的)CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭采集器怎么采集 采集信息 的網(wǎng)址CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭采集器采集內(nèi)容之前是先采集網(wǎng)址的,所以你說的這個網(wǎng)址其實早就知道了,而采集內(nèi)容的時候是不會采集到得,因為一般情況下一個網(wǎng)頁的源代碼里不會有這個網(wǎng)頁的網(wǎng)址。
    比如A是一個網(wǎng)頁的網(wǎng)址,用火車頭采集器的時候首先讀取的就是這個網(wǎng)頁地址A,然后再根據(jù)這個地址來請求數(shù)據(jù),根據(jù)你的采集規(guī)則來采集內(nèi)容,而這個網(wǎng)頁的內(nèi)容里沒有這個網(wǎng)址A,那么你肯定是采集不到的。那么這個網(wǎng)址A在哪里呢?在生成的文件里。
    比如你保存到本地之后生成一個CSV的文件,打開之后再最后一列(URL)就是采集的內(nèi)容對應的這個網(wǎng)址。追問

    那怎么將采集內(nèi)容相關的網(wǎng)址保存到數(shù)據(jù)庫呢CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    追答

    沒看懂我的意思嗎?采集的內(nèi)容對應的網(wǎng)址已經(jīng)采集到你的數(shù)據(jù)庫里了,你保存成.csv文件后,打開,最后一列就是網(wǎng)址。你可以選擇將你采集到的內(nèi)容那一列和url網(wǎng)址那一列合并,就跟excel里合并單元格一個意思。CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭如何采集還有縮略圖的文章呢CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    1、首先在采集列表頁的源碼中將帶有縮略圖的那部分源碼復制下來,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    2、查看網(wǎng)站的源碼,找到這行代碼,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司


    CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    3、打開火車頭,進入采集網(wǎng)址規(guī)則—添加多級網(wǎng)址采集規(guī)則,選中手動填寫鏈接地址規(guī)則,并將第二步驟中選中的代碼粘貼進去,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    4、將代碼進行如下修改:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    5、改好后保存并進行采集測試,如圖所示CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    6、然后再在采集內(nèi)容規(guī)則里進行修改,選中“縮略圖”標簽,打開,進行內(nèi)容替換,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    7、然后點擊文件下載,選中下載圖片,并填好縮略圖保存路徑及命名方式,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    8、在“文件保存及部分高級設置”里設定縮略圖的保存盤符及其前綴,我設定為桌面,前綴為“./”,如圖:CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司


    9、我們保存后測試一下,一起順利,縮略圖順利采集下來了
    CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    追問

    是最近版本的嗎?CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭插件怎么采集(火車頭插件怎么采集的)CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    火車頭采集器怎么采集今日頭條文章?CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    第一步采集網(wǎng)址,下載好火車頭采集器后打開,新建一個任務,任務名隨意。把需要采集的網(wǎng)站文章列表頁網(wǎng)址添加到起始網(wǎng)址。從圖中看出該列表頁有34頁,每頁有N篇文章。
    2
    列表頁會一級網(wǎng)址,添加多級網(wǎng)址獲取,從而獲取二級網(wǎng)址(文章頁網(wǎng)址)
    設置列表分頁獲取,3個地方分別是:分頁源代碼前面和后面還有中間位置。這一步用于獲取列表頁面鏈接,因為有34個列表頁面。設置完保存。
    網(wǎng)址獲取選項,這一步用于獲取列表頁上面文章頁的鏈接,根據(jù)自己需要設置需要截取的部分和根據(jù)網(wǎng)址的結(jié)構(gòu)設置包含與不包含某些字符。為空即沒限制,設置完保存。
    設置好鏈接采集規(guī)則后,可以測試網(wǎng)址,看測試結(jié)果調(diào)整規(guī)則??磮D可以看到采集鏈接規(guī)則從起始鏈接到全面列表頁再到列表頁上的文章頁鏈接都已經(jīng)成功采集。
    第二步是采集內(nèi)容,首先修改標題規(guī)則,在頁面源代碼里面找到標題的代碼,把標題前后代碼負責過去截取出標題。保存。
    修改內(nèi)容采集規(guī)則,跟標題規(guī)則差不多,也是源代碼里面找到內(nèi)容的前后代碼。這里內(nèi)容會有一些其他html標簽,所以得添加一個html標簽排除的規(guī)則。
    完成后,測試看一下結(jié)果,從測試結(jié)果來調(diào)試規(guī)則,直到測試結(jié)果是自己想要的內(nèi)容為止。
    第三步是采集導出。前面1、2兩步把規(guī)則設置好,最后就要把文章導出了。先做一個導出的模版。
    然后選擇方式二,把每一篇文章都分別記錄到一個txt文本,保存位置自己選擇,模板選擇剛剛做好的導出模版.保存的文件名用文章標題為命名。其他默認,保存。
    把采集網(wǎng)址,采集內(nèi)容,發(fā)布3個選項框都勾選,然后開始采集。完成后文本就自動生成在剛剛保存的文件夾里面了。
    火車頭采集器采集文章教程到此就完成了,由于每個網(wǎng)站都是不一樣的,所以這里只能用一個網(wǎng)站演示,只是一個方法思路,自己采集文章還需要靈活變通。追問

    這樣復雜粘貼有意思嗎?CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司

    以上就是關于火車頭插件怎么采集相關問題的回答。希望能幫到你,如有更多相關問題,您也可以聯(lián)系我們的客服進行咨詢,客服也會為您講解更多精彩的知識和內(nèi)容。CnP創(chuàng)意嶺 - 安心托付、值得信賴的品牌設計、營銷策劃公司


    推薦閱讀:

    火車頭偽原創(chuàng)文章生成器(火車頭偽原創(chuàng)工具)

    杭州到息縣火車一天幾趟(杭州到息縣火車一天幾趟?。?/a>

    杭州火車南站在哪(杭州站火車時刻表)

    手機上的抖音怎么和電腦同步(手機上的抖音怎么和電腦同步呢)

    華語歌壇十大排名(華語歌壇十大排名歌手)