監(jiān)理公司管理系統(tǒng) | 工程企業(yè)管理系統(tǒng) | OA系統(tǒng) | ERP系統(tǒng) | 造價(jià)咨詢管理系統(tǒng) | 工程設(shè)計(jì)管理系統(tǒng) | 甲方項(xiàng)目管理系統(tǒng) | 簽約案例 | 客戶案例 | 在線試用
X 關(guān)閉

泛普軟件分析聚焦爬蟲技術(shù)和特定主題—OA 資源

申請免費(fèi)試用、咨詢電話:400-8352-114

  泛普軟件分析聚焦爬蟲技術(shù)和特定主題—OA 資源

  1 聚焦爬蟲技術(shù)

  泛普軟件通過文獻(xiàn)檢索獲知:聚焦爬蟲(Focused Crawler)又稱為主題爬蟲(Topical Crawler),它的工作流程(如圖1)比傳統(tǒng)網(wǎng)絡(luò)爬蟲復(fù)雜一些,在抓取頁面并提取出URL以后,會(huì)根據(jù)相應(yīng)的URL分析算法保留盡可能多的主題相關(guān)度高的URL,并將其放入等待抓取的URL隊(duì)列;與主題無關(guān)或相關(guān)度不高的URL將被丟棄。然后再從URL隊(duì)列里讀取URL進(jìn)行抓取,并重復(fù)上述過程,直到滿足爬行停止條件為止。而且,聚集爬出的系統(tǒng)中有專門的數(shù)據(jù)庫,用來存貯被爬蟲抓取的網(wǎng)頁,并有專門的功能模塊對(duì)網(wǎng)頁進(jìn)行內(nèi)容分析、特征詞提取,從而建立起相應(yīng)的主題特征詞庫。特征詞庫建立以后,可以更好的對(duì)之后抓取的網(wǎng)頁進(jìn)行分析和評(píng)價(jià),把與主題無關(guān)或相關(guān)度不高的網(wǎng)頁排除。

  2 特定主題—OA 資源

  泛普軟件通過文獻(xiàn)檢索獲知:Open Access即開放存取,簡稱OA,2002年2月14日發(fā)表的《布達(dá)佩斯開放存取計(jì)劃》對(duì)OA做了如下的定義:“古老的學(xué)術(shù)傳統(tǒng)和嶄新的技術(shù)已經(jīng)結(jié)合起來,可能將給公眾帶來空前的利益。古老的學(xué)術(shù)傳統(tǒng)是為了接受咨詢和傳播知識(shí)的目的,在毋需付費(fèi)的條件下,科學(xué)家和學(xué)者們很樂意將自己的研究成果發(fā)表于學(xué)術(shù)期刊上。嶄新的技術(shù)是英特網(wǎng)。這種結(jié)合可能將給公眾帶來的利益就是:經(jīng)過同行評(píng)價(jià)的期刊文獻(xiàn)可以被所有的科學(xué)家、學(xué)者、教師、學(xué)生以及其他充滿好奇心的人在全球范圍內(nèi)發(fā)布其電子文本并可以完全免費(fèi)的、無限制的使用。消除對(duì)這些文獻(xiàn)的存取障礙將會(huì)加快研究的速度,使教育更加豐富多彩,富人與窮人之間互相共享彼此的學(xué)問,從而使這些文獻(xiàn)達(dá)到最大限度的利用,并在共同的理智交流和知識(shí)的追求中建立人類聯(lián)合的基礎(chǔ)。這種免費(fèi)的無限制的聯(lián)機(jī)獲取方式,稱之為開放存取(open access)。”

  Open Access是國際科技界、學(xué)術(shù)界、出版界、信息傳播界為推動(dòng)科研成果利用網(wǎng)絡(luò)自由傳播而發(fā)起的運(yùn)動(dòng)。通過網(wǎng)絡(luò)技術(shù),任何人可以免費(fèi)的獲得各類文獻(xiàn)。

  此文章為泛普軟件所寫,轉(zhuǎn)載請留版權(quán),泛普軟件專注OA,OA系統(tǒng),OA辦公系統(tǒng),OA軟件,OA辦公軟件。 m.52tianma.cn

  泛普軟件編輯

發(fā)布:2006-12-13 22:12    編輯:泛普軟件 · hujian    [打印此頁]    [關(guān)閉]
相關(guān)文章:

泛普泛普期刊其他應(yīng)用

泛普OA商務(wù)合同 泛普OA需求調(diào)研 泛普OA實(shí)施方案 泛普OA項(xiàng)目啟動(dòng) 泛普網(wǎng)絡(luò)硬件配置 泛普OA部署安裝 泛普流程模板表單 OA系統(tǒng)二次開發(fā) 泛普常見問題解決 泛普OA操作手冊 泛普軟件項(xiàng)目驗(yàn)收 泛普培訓(xùn)推廣上線 泛普OA售后服務(wù) 泛普新聞 泛普期刊 泛普博客