-
當(dāng)前位置:首頁 > 創(chuàng)意學(xué)院 > 營銷推廣 > 專題列表 > 正文
文章關(guān)鍵詞怎么提取(文章關(guān)鍵詞怎么提取工具)
大家好!今天讓創(chuàng)意嶺的小編來大家介紹下關(guān)于文章關(guān)鍵詞怎么提取的問題,以下是小編對(duì)此問題的歸納整理,讓我們一起來看看吧。
創(chuàng)意嶺作為行業(yè)內(nèi)優(yōu)秀的企業(yè),服務(wù)客戶遍布全球各地,相關(guān)業(yè)務(wù)請(qǐng)撥打電話:175-8598-2043,或添加微信:1454722008
本文目錄:
一、如何使用word提取文章中的關(guān)鍵詞
1.點(diǎn)擊word“開始”菜單最右側(cè)的“查找”。
2.出現(xiàn)“查找”對(duì)話框,填寫需要查找的內(nèi)容,點(diǎn)擊“確定”。
3.反復(fù)點(diǎn)擊“查找下一處”,即可在文中依次找到相同的內(nèi)容,也可點(diǎn)擊“閱讀突出提示”下拉菜單中的“全部突出顯示”,將文中所有相同的內(nèi)容突出顯示。
4.需要替換文中內(nèi)容時(shí)候,點(diǎn)擊“開始”菜單最右側(cè)的“替換”,出現(xiàn)“查找和替換”對(duì)話框,依次填寫需要查找的內(nèi)容和需要替換為的內(nèi)容,點(diǎn)擊“全部替換”,文中所有相同的內(nèi)容即可同時(shí)完成替換。
5.若點(diǎn)擊“替換”則每點(diǎn)擊一次,軟件會(huì)替換一次,然后自動(dòng)尋找下一處相同的內(nèi)容,反復(fù)點(diǎn)擊,即可完成對(duì)文檔中所有相同內(nèi)容的替換。
二、閱讀時(shí)怎么找文中的關(guān)鍵詞
很簡單~把問題和閱讀文章對(duì)比著看,先把問題中的關(guān)鍵詞找出來,一般是名字,日期,有大寫字母的詞,一些比較扎眼容易找到的詞(動(dòng)詞、賓語有時(shí)也會(huì)用做關(guān)鍵詞),先明確問題要問什么,然后再把問題中的選項(xiàng)瀏覽一遍,然后回到原文,相對(duì)應(yīng)問題中畫出來的關(guān)鍵詞在原文中找到一樣的詞,這個(gè)詞就是文中的關(guān)鍵詞,圍繞著這個(gè)關(guān)鍵詞講述的事情仔細(xì)讀懂,其他與關(guān)鍵詞無關(guān)的話就可以不看了,然后把自己理解的意思與問題中的選項(xiàng)對(duì)比~接近的就是正確答案了~
三、用Py做文本分析5:關(guān)鍵詞提取
關(guān)鍵詞指的是原始文檔的和核心信息,關(guān)鍵詞提取在文本聚類、分類、自動(dòng)摘要等領(lǐng)域中有著重要的作用。
針對(duì)一篇語段,在不加人工干預(yù)的情況下提取出其關(guān)鍵詞
無監(jiān)督學(xué)習(xí)——基于詞頻
思路1:按照詞頻高低進(jìn)行提取
思路2:按照詞條在文檔中的重要性進(jìn)行提取
IF-IDF是信息檢索中最常用的一種文本關(guān)鍵信息表示法,其基本的思想是如果某個(gè)詞在一篇文檔中出現(xiàn)的頻率高,并且在語料庫中其他文檔中很少出現(xiàn),則認(rèn)為這個(gè)詞具有很好的類別區(qū)分能力。
TF:Term Frequency,衡量一個(gè)term在文檔中出現(xiàn)得有多頻繁。平均而言出現(xiàn)越頻繁的詞,其重要性可能就越高??紤]到文章長度的差異,需要對(duì)詞頻做標(biāo)準(zhǔn)化:
IDF:Inverse Document Frequency,逆文檔概率,用于模擬在該語料的實(shí)際使用環(huán)境中,目標(biāo)term的重要性。
TF-IDF:TF*IDF
優(yōu)點(diǎn):
(1)jieba
(2)sklearn
(3)gensim
前面介紹的TF-IDF屬于無監(jiān)督中基于詞頻的算法,TextRank算法是基于圖形的算法。
TextRank算法的思想來源于PageRank算法:
和基于詞頻的算法相比,TextRank進(jìn)一步考慮了文檔內(nèi)詞條間的語義關(guān)系。
參考資料:
Python數(shù)據(jù)分析--玩轉(zhuǎn)文本挖掘
四、數(shù)學(xué)建模論文中的關(guān)鍵詞怎樣提取?
正確選取和標(biāo)引關(guān)鍵詞,既有利于論文被檢索,也有利于擴(kuò)大該成果的利用率,其作用不可小覷。那么如何提取,請(qǐng)看以下總結(jié)。
一、化學(xué)分子式不可作關(guān)鍵詞,而應(yīng)用化學(xué)名稱
如應(yīng)用“氯化鈉”,而不可用“Nacl”。通??s寫詞也不可作關(guān)鍵詞,“HBsAg”應(yīng)標(biāo)引為“乙型肝炎病毒表面抗原”,但已普遍使用的縮寫詞除外,如DNA、CT等。
切忌隨便縮寫關(guān)鍵詞,比如,將再生障礙性貧血寫作“再障”,將肺源性心臟病寫作“肺心病”,將肩關(guān)節(jié)周圍炎寫作“肩周炎”等,都是不符合名詞術(shù)語規(guī)范的。還有的使用藥品的商品名,如“都可喜”“胃復(fù)安”等也是不符合規(guī)范的。
二、不宜用過長的句子成分來代替關(guān)鍵詞
關(guān)鍵詞之間固然可相互組配,但詞與詞之間大多是孤立的,語法上無關(guān)聯(lián)。因此用過長的句子成分來代替關(guān)鍵詞是不宜的,也不符合盡量用規(guī)范的檢索語言來標(biāo)引關(guān)鍵詞的原則。
在醫(yī)學(xué)論文中不應(yīng)將諸如“眼眶良性淋巴組織增生性疾病”“肝炎后肝硬化”等作為關(guān)鍵詞,而應(yīng)把它們分別改為“淋巴組織增生?。谎劭簟薄奥愿窝?;肝硬化”。
三、選好首標(biāo)詞
首標(biāo)詞是表達(dá)文章主題最核心的關(guān)鍵詞,它是數(shù)個(gè)關(guān)鍵詞第一個(gè)標(biāo)引的詞,它的選擇是否準(zhǔn)確,直接關(guān)系到關(guān)鍵詞標(biāo)引的質(zhì)量和影響到醫(yī)學(xué)文獻(xiàn)檢索的速度和準(zhǔn)確度。如果認(rèn)為選取關(guān)鍵詞只要選全就可以是不妥的,選詞排序應(yīng)有主有次,主次明確。
醫(yī)學(xué)論文標(biāo)題是高度概括精煉而成,通常包含研究目的、研究對(duì)象、實(shí)驗(yàn)方法和技術(shù)。標(biāo)題中的專業(yè)詞匯在很大程度上概括了主題的含義,所以首先可以考慮從標(biāo)題中選取首標(biāo)詞。
當(dāng)論文篇名中的概念寫得過大或過小時(shí),首標(biāo)詞的選取就不能局限在標(biāo)題的范圍內(nèi),應(yīng)進(jìn)一步在論文的摘要中選擇。
醫(yī)學(xué)論文在標(biāo)引數(shù)個(gè)關(guān)鍵詞時(shí),因標(biāo)題中經(jīng)常將研究對(duì)象或?qū)嶒?yàn)(手術(shù))方法排列在前,故以研究對(duì)象、實(shí)驗(yàn)方法和診斷與治療手段作首標(biāo)詞的較多見,這是錯(cuò)誤的。
例如,“兒童過敏性紫癜108例臨床分析”一文的首標(biāo)詞應(yīng)為“過敏性紫癜”,而不應(yīng)為“兒童”;“超聲中頻電療法治療顳下頜關(guān)節(jié)病的療效觀察”一文的首標(biāo)詞應(yīng)為“顳下頜關(guān)節(jié)病”,而不應(yīng)為“超聲療法”。
四、詞性宜實(shí)不宜虛
關(guān)鍵詞的標(biāo)引從詞語的意義上講,應(yīng)該是具體、實(shí)在的。應(yīng)盡量避免用抽象、空洞的詞來做關(guān)鍵詞,因?yàn)槿狈︶槍?duì)性的標(biāo)引是無效標(biāo)引。
例如“外科治療小兒先天性髖脫位的手術(shù)指征”的關(guān)鍵詞:先天性髖脫位、小兒、外科治療、手術(shù)指征,“外科治療”和“手術(shù)指征”均為無實(shí)質(zhì)性內(nèi)容的關(guān)鍵詞,應(yīng)刪去,補(bǔ)充一個(gè)具體手術(shù)方法“髖臼成形術(shù)”做關(guān)鍵詞。
再比如,“產(chǎn)科急癥子宮切除29例臨床分析”關(guān)鍵詞:產(chǎn)科、急癥子宮切除、并發(fā)癥、臨床分析,正確標(biāo)引應(yīng)改為“胎盤粘連、宮縮乏力、子宮破裂”(病因),“產(chǎn)后出血”(結(jié)果),“子宮全切術(shù)”(手術(shù)方式)。
五、專指性規(guī)則
一個(gè)關(guān)鍵詞最好只表達(dá)一個(gè)主題概念,這樣不容易產(chǎn)生歧義。例如,“癌前病變”這一詞組就不適合作為關(guān)鍵詞,因?yàn)樗痪邆鋵V感浴?/p>
我們知道,“肝硬化”是肝癌的癌前病變,“慢性萎縮性胃炎”是胃癌的癌前病變,“乳腺纖維性增生”是乳癌的癌前病變,“潰瘍性結(jié)腸炎”是腸癌的癌前病變。僅標(biāo)一個(gè)“癌前病變”,不清楚到底指的是哪一種癌癥。
關(guān)鍵詞在論文標(biāo)題中的出現(xiàn)率一般在85%以上,在摘要中的出現(xiàn)率為90%,只有10%~15%的關(guān)鍵詞從正文中選標(biāo)。最成功的關(guān)鍵詞標(biāo)引,是這組關(guān)鍵詞包括了該篇文章的全部信息,至少應(yīng)準(zhǔn)確表達(dá)文章的中心內(nèi)容和研究主題。
但不容樂觀的是,很多人圖省事兒,不進(jìn)行全文閱讀和主題分析,僅根據(jù)文題草率選擇幾個(gè)詞充作關(guān)鍵詞。筆者的體會(huì)是,選取和標(biāo)引關(guān)鍵詞,要以全文為依據(jù),以結(jié)論和摘要為重點(diǎn),以標(biāo)題為首選,避免誤標(biāo)、漏標(biāo)和復(fù)標(biāo)的情況發(fā)生。
投稿作者可登陸http://www.ncbi.nlm.nih.gov/mesh網(wǎng)站從美國國立醫(yī)學(xué)圖書館的MeSH數(shù)據(jù)庫中選取關(guān)鍵詞,其中文譯名可參照中國醫(yī)學(xué)科學(xué)院信息研究所編譯的《醫(yī)學(xué)主題詞注釋字順表》。
以上就是關(guān)于文章關(guān)鍵詞怎么提取相關(guān)問題的回答。希望能幫到你,如有更多相關(guān)問題,您也可以聯(lián)系我們的客服進(jìn)行咨詢,客服也會(huì)為您講解更多精彩的知識(shí)和內(nèi)容。
推薦閱讀:
文章生成器哪個(gè)好?Ai原創(chuàng)文章生成軟件排名
微信公眾號(hào)文章閱讀量太低怎么辦?提高閱讀量的幾個(gè)技巧
浙江企業(yè)100強(qiáng)名單(浙江企業(yè)100強(qiáng)名單查詢)
喜迎春節(jié)活動(dòng)方案(喜迎春節(jié)活動(dòng)方案策劃)
猜你喜歡
市場營銷的學(xué)科性質(zhì)(市場營銷的學(xué)科性質(zhì)是什么)
市場挑戰(zhàn)者采用的競爭戰(zhàn)略應(yīng)該是(市場挑戰(zhàn)者的主要競爭策略包括)
陜西眾創(chuàng)空間怎么樣(陜西眾創(chuàng)空間待遇怎么樣)
新品怎么刷關(guān)鍵詞(新品上架怎么刷關(guān)鍵詞)
全國大學(xué)創(chuàng)業(yè)生服務(wù)網(wǎng)(全國大學(xué)創(chuàng)業(yè)生服務(wù)網(wǎng)官網(wǎng))
設(shè)計(jì)商標(biāo)圖案(logo設(shè)計(jì))