- 相關推薦
本科論文權威查重軟件有哪些
本科論文是要進行查重的,那權威的查重軟件有哪些呢?
本科論文權威查重軟件
答:知網(wǎng)
本科論文權威查重軟件
知網(wǎng)(英文名稱為HowNet)是一個以漢語和英語的詞語所代表的概念為描述對象,以揭示概念與概念之間以及概念所具有的屬性之間的關系為基本內容的常識知識庫。
要掌握和利用好知網(wǎng)系統(tǒng),必須首先了解知網(wǎng)系統(tǒng)的哲學思想。
知網(wǎng)系統(tǒng)的哲學也就是說它對客觀世界的認識與把握。
知網(wǎng)哲學的根本點是:世界上一切事物(物質的和精神的)都在特定的時間和空間內不停地運動和變化。
它們通常是從一種狀態(tài)變化到另一種狀態(tài), 并通常由其屬性值的改變來體現(xiàn)。
試以人為例,人的生老病死是一生的主要狀態(tài)。
這個人的年齡(屬性)一年比一年大{屬性值},隨著年齡的增長頭發(fā)的顏色(屬性)變?yōu)榛野讃屬性值}。
另一方面,一個人隨著年齡的增長他的性格(精神)變得日益成熟{屬性值},他的知識(精神產品)愈益豐富{屬性值}。
基于上述,知網(wǎng)的運算和描述的基本單位是:萬物,其中包括物質的和精神的兩類,部件,屬性,時間,空間,屬性值以及事件。
特別要強調的是,部件和屬性,這兩個基本單位在知網(wǎng)的哲學體系中占有著重要的地位。
關于對部件的認識是:每一個事物都可能是另外一個事物的部件,同時每一個事物也可能是另外一個事物的整體。
門和窗是建筑物的部件;手和腳是動物的部件。
但與此同時,一個建筑物又可能是一個社區(qū)的部件;一個人又可能是他所屬的家庭或社會的部件。
一切事物都可以分解為部件。
沒有一種事物只是整體,而不會是部件。
我們認為一個事物被視為是整體還是部件,可以因系統(tǒng)的不同,而不同對待。
關于部件在整體中的部位和它的功能,知網(wǎng)遵循這樣一種認識:事物的部件在它整體中的部位和功能的描述大體上比照人體。
例如:山頭、山腰、山腳、桌腿、椅背、河口,建筑物的門和窗比照人體的口和眼等等。
漢語用擬人的手法來描述部件,別的語言也類似,這反映了人類認識事物方法的共性。
關于對屬性的認識是:任何一個事物都一定包含著多種屬性,事物之間的異或同是由屬性決定的,沒有了屬性就沒有了事物。
人有種族、膚色、性別、年齡、性格、會思維、會使用語言等自然屬性以及國籍、出身、職業(yè)、貧富等社會屬性。
在某些特定的情況下可以說屬性比事物更重要,這一點在人們的日常生活的替代活動中可以得到體現(xiàn)。
如:當我們要把一個釘子釘?shù)綁ι,但我們沒有錘子,于是我們要找錘子的替代物,那么什么是錘子的替代物呢?那應該是屬性最接近錘子的屬性的物品才可能是替代物,而這時重量和硬度是關鍵性的屬性。
屬性和它的宿主之間的關系是固定的,這是說有什么樣的宿主就有什么樣的屬性,反之亦然。
屬性與宿主之間的關系同部件與整體之間的關系是不同的。
這也體現(xiàn)在知網(wǎng)在涉及屬性的標注規(guī)范上,知網(wǎng)規(guī)定在標注屬性時必須標注它可能的宿主的類型。
知網(wǎng)還規(guī)定在標注屬性值時都必須標注它所指向的屬性。
網(wǎng)站特色
計算機化是知網(wǎng)的重要特色。
知網(wǎng)是面向計算機的,是借助于計算機建立的,將來可能是計算機的智能構件。
知網(wǎng)作為一個知識系統(tǒng),實副其名是一個網(wǎng)而不是樹。
它所著力要反映的是概念的共性和個性,例如:對于"醫(yī)生"和"患者","人"是它們的共性。
知網(wǎng)在主要特性文件中描述了"人"所具有的共性,那么"醫(yī)生"的個性是他是"醫(yī)治"的施事,而"患者"的個性是他是"患病"的經(jīng)驗者。
對于"富翁"和"窮人","美女"和"丑八怪"而言,"人"是它們的共性。
而它們的個性,即:"貧"、"富"與"美"、"丑"等不同的屬性值,則是它們的個性。
同時知網(wǎng)還著力要反映概念之間和概念的屬性之間的各種關系。
知網(wǎng)把下面的一種知識網(wǎng)絡體系明確的教給了計算機進而使知識對計算機而言是可操作的。
總的來說,知網(wǎng)描述了下列各種關系:
(a) 上下位關系 (由概念的主要特征體現(xiàn),請參看《知網(wǎng)管理工具》)
(b) 同義關系(可通過《同義、反義以及對義組的形成》獲得)
(c) 反義關系(可通過《同義、反義以及對義組的形成》獲得)
(d) 對義關系(可通過《同義、反義以及對義組的形成》獲得)
(e) 部件-整體關系(由在整體前標注 % 體現(xiàn),如"心","CPU"等)
(f) 屬性-宿主關系(由在宿主前標注 & 體現(xiàn),如"顏色","速度"等)
(g) 材料-成品關系(由在成品前標注 ? 體現(xiàn),如"布","面粉"等)
(h) 施事/經(jīng)驗者/關系主體-事件關系(由在事件前標注 * 體現(xiàn),如"醫(yī)生","雇主"等)
(i) 受事/內容/領屬物等-事件關系(由在事件前標注 $ 體現(xiàn),如"患者","雇員"等)
(j) 工具-事件關系(由在事件前標注 * 體現(xiàn),如"手表","計算機"等)
(k) 場所-事件關系(由在事件前標注 @ 體現(xiàn),如"銀行","醫(yī)院"等)
(l) 時間-事件關系(由在事件前標注 @ 體現(xiàn),如"假日","孕期"等)
(m) 值-屬性關系(直接標注無須借助標識符,如"藍","慢"等)
(n) 實體-值關系(直接標注無須借助標識符,如"矮子","傻瓜"等)
(o) 事件-角色關系(由加角色名體現(xiàn),如"購物","盜墓"等)
(p) 相關關系(由在相關概念前標注 # 體現(xiàn),如"谷物","煤田"等)
知網(wǎng)的一個重要特點是:類似于同義、反義、對義等種種關系是借助于《同義、反義以及對義組的形成》由用戶自行形成而不是逐一地、顯性地標注在各個概念之上的。
知網(wǎng)是一個知識系統(tǒng),而不是一部語義詞典。
盡管被我們稱為知識詞典的常識性知識庫是知網(wǎng)的最基本的數(shù)據(jù)庫。
知網(wǎng)的全部的主要文件包括知識詞典構成了一個有機結合的知識系統(tǒng)。
例如,主要特征文件、次要特征文件、同義、反義以及對義組的形成,以及事件關系和角色轉換等都是系統(tǒng)的重要組成部分,而不僅僅是標注的規(guī)格文件。
我們預計用戶將來把它們與知識詞典一起加以利用。
建設方法
概述
知網(wǎng)是一個以上述各類概念為描述對象的知識系統(tǒng)。
知網(wǎng)不是一部義類詞典。
知網(wǎng)是把概念與概念之間的關系以及概念的屬性與屬性之間的關系形成一個網(wǎng)狀的知識系統(tǒng)。
這是它與其他的樹狀的詞匯數(shù)據(jù)庫的本質不同。
知網(wǎng)的哲學和它的根本特性決定了它的特別的建設方法。
義原的提取
什么是義原,跟什么是詞一樣的難以定義。
但是也跟詞一樣并不因為它難于定義人們就無法把握和利用它們。
大體上說,義原是最基本的、不易于再分割的意義的最小單位。
例如:"人"雖然是一個非常復雜的概念,它可以是多種屬性的集合體,但我們也可以把它看作為一個義原。
我們設想所有的概念都可以分解成各種各樣的義原。
同時我們也設想應該有一個有限的義原集合,其中的義原組合成一個無限的概念集合。
如果我們能夠把握這一有限的義原集合,并利用它來描述概念之間的關系以及屬性與屬性之間的關系,我們就有可能建立我們設想的知識系統(tǒng)。
利用中文來尋求這個有限的集合,應該說是個捷徑。
中文中的字(包括單純詞)是有限的,并且它可以被用來表達各種各樣的單純的或復雜的概念,以及表達概念與概念之間、概念的屬性與屬性之間的關系。
所用方法的一個重要特點是對大約六千個漢字進行考察和分析來提取這個有限的義原集合。
以事件類為例,在中文中具有事件義原的漢字(單純詞)中我們曾提取出3200個義原。
試以下面為例我們得到了9個義原但其中有兩對是重復應予合并。
治:醫(yī)治 管理 處罰 ……
處:處在 處罰 處理 ……
理:處理 整理 理睬 ……
3200個事件義原在初步合并后大約可以得到1700個,然后我們再進一步加以歸類,我們便得到大約700多個義原。
當我們發(fā)現(xiàn)這700多個義原不符合或不滿足要求時,我們便進行的合理調整或適當擴充。
這樣就形成了今天的800多個事件義原的標注集以及由它們標注的中文的事件概念。
綜上所述,知網(wǎng)的建設方法的一個重要特點是自下而上的歸納的方法。
它是通過對全部的基本義原進行觀察分析并形成義原的標注集,然后再用更多的概念對標注集進行考核,據(jù)此建立完善的標注集。
義原的考核與確定
第一、在擴大標注中觀察該義原的覆蓋面。
原則:已有的義原一定要能夠描述全部的概念。
這里有一個比較硬性的規(guī)定,即當發(fā)現(xiàn)一個具有多個概念的詞語,例如八個,而以有的義原不能夠把這八個概念區(qū)別開來時,就必須對我們的標注集加以調整,這是絕大多數(shù)的情況。
在很個別的情況下不排除懷疑其中某個概念是否存在,以決定取舍。
第二、觀察某一個義原在概念之間關系中的地位。
如果一個義原在同類別的許多概念中出現(xiàn)或者不同類別的概念中出現(xiàn),那么這樣的義原就是穩(wěn)定的義原是一個必須確定的義原。
以事件類"醫(yī)治"這個義原為例,它不僅出現(xiàn)在"醫(yī)"、"治"、"治療"、"醫(yī)療"、"治病"、"求醫(yī)"、"看病"等概念中,并且還出現(xiàn)在"醫(yī)生"、"醫(yī)院"、"醫(yī)藥"、"診所"、"不治之癥"、"有病亂投醫(yī)"。
因此,"醫(yī)治"這個義原是穩(wěn)定的、是必須確定的。
無論是義原的提取還是義原的考核與確定,在知網(wǎng)的建設中都是至關重要的和具有決定意義的。
它們貫穿于知網(wǎng)建設的全過程。
因此,知網(wǎng)建設的方法的主要特點是:(1)自下而上的;(2)標注集的形成和知網(wǎng)建設是互動的。
系統(tǒng)概貌
數(shù)據(jù)文件和程序
1.知網(wǎng)管理系統(tǒng)
2.中英雙語知識詞典
知網(wǎng)的規(guī)模主要取決于雙語知識詞典數(shù)據(jù)文件的大小。
由于它是在線的,修改和增刪都很方便,因此它的規(guī)模是動態(tài)的。
它的規(guī)模通常以詞語的條數(shù)以及由詞語所表述的概念的條數(shù)計算。
詞典記錄
知識詞典是知網(wǎng)系統(tǒng)的基礎文件。
在這個文件中每一個詞語的概念及其描述形成一個記錄。
每一種語言的每一個記錄都主要包含4項內容。
其中每一項都由兩部分組成,中間以"="分隔。
每一個"="的左側是數(shù)據(jù)的域名,右側是數(shù)據(jù)的值。
它們排列如下:
W_X= 詞語
E_X= 詞語例子
G_X= 詞語詞性
DEF= 概念定義
詞語概念選擇
第一,我們不認為漢語有很嚴格的、如印歐語言那樣的"詞"。
因此知識詞典的描述的最基本單位,不必要去追求嚴格的關于詞的定義。
我們選擇詞語的依據(jù)是建立于4億字漢語語料庫按出現(xiàn)頻率形成的詞語表,而不是僅僅依據(jù)某一本現(xiàn)成的詞典。
知識詞典很注意收集已經(jīng)流行又有較固定可能的詞語,如"因特網(wǎng)"、"歐元"、"二惡英"、"下載"、"點擊"、"黑客"等,但又不盲目求新,如不收"打的"。
第二,詞語的概念或稱義項的選擇也是經(jīng)過精心考慮的。
一般很注意某一義項的現(xiàn)代的流通性。
例如"曹"在普通詞典中至少有兩個義項,一是"姓",另一是"輩"如用于"爾曹"。
而知識詞典只選擇第一個義項。
第三,我們同時給出了與詞語相對應的英文釋義。
我們的目的是體認知識詞典對概念的描述方法是否也適用于另一種語言。
按理是應該能夠適合的。
我們的目的當然不是為最終用戶提供普通的漢英詞典。
詞語例子
迄今為止,我們主要是為那些具有多個義項提供例子。
這些例子的要求是:強調例子的區(qū)別能力而不是它們的釋義能力。
它們的用途在于為消除歧義提供可靠的幫助。
這里試以"打"的兩個義項為例,一個義項是"buy/買",另一個是"weave/辮編"。
定義標注
知網(wǎng)對概念的描述是要著力體現(xiàn)概念與概念和概念的屬性與屬性之間的相互關系,因此,知網(wǎng)對于概念的描述必然是復雜的。
這就必須有一套明確的規(guī)范,否則便無法保證描述的復雜度和描述的一致性。
概念描述既有總的、一般性的描述,也有因不同類別的細節(jié)性描述。
但是,描述的方法和規(guī)定又必須保證能夠最大限度地表現(xiàn)概念與概念和概念的屬性與屬性之間的相互關系。
事實證明滿足復雜性和一致性統(tǒng)一的要求的可行途徑是設計一種知識詞典的描述語言。
知網(wǎng)建設的過程也是設計與建立這樣的描述語言的過程。
規(guī)定
簡要概括
(1) 任何一個概念的DEF項是必須填寫的,不得為空。
(2) DEF項中用以定義的特性至少是一個,但也可以是多個,數(shù)量沒有限制,只要內容是合理的且形式是合乎規(guī)范的。
(3) DEF項的第一位置所標注的必須是知網(wǎng)所規(guī)定的主要特征(詳見《知網(wǎng)管理工具》),否則視為語法錯誤。
但是有些關系意義,可以把次要特征置于{}中后,作為第一位置標注。
例如一些介詞、連詞等虛詞,嚴格地說它們本身沒有概念意義
(4) 多個特征之間應以英文逗號","分隔,且逗號與特征之間沒有空格。
(5) 除第一位置以外,其他位置也可以填有主要特征,但應該說明的是,當主要特征在非第一位置時它失去了原有的上下位關系。
(6) DEF項中任何一個位置上的信息都可以帶有知網(wǎng)所規(guī)定的標示符號。
細節(jié)
關于事件類概念的規(guī)定
(1) DEF項的第一位置只能是事件類文件所規(guī)定的主要特征;
(2) 對于那些以事件為中心的復雜概念的標注則應遵循如下規(guī)定:
(a) 應利用動態(tài)角色來標注復雜概念,因為所謂的復雜概念多半是除了事件中心本身以外還有一個或一個以上的動態(tài)角色。
(b) 在表示上述動態(tài)角色時它的書寫格式是:動態(tài)角色名稱 = 主要特征或次要特征。
關于屬性值和數(shù)量值類概念的規(guī)定
(1) "屬性值"是所有屬于屬性值概念的唯一的主要特征,"數(shù)量值"是所有屬于數(shù)量值概念的唯一的主要特征,
因此他們分別是兩類概念的首位標識(2) 屬性值概念和數(shù)量值概念除首位標識外必須還包含有一個次要特征。
在第二位上一定要標注該屬性值或數(shù)量值所指向的屬性或數(shù)量特征(3) 通常絕大多數(shù)情況下在第三位置上標注該屬性值或數(shù)量值的具體值
關于屬性和數(shù)量類概念的規(guī)定
(1) "屬性"是所有屬于屬性概念的唯一的主要特征,"數(shù)量"是所有屬于數(shù)量概念的唯一的主要特征,因此他們分別是兩類概念的首位標識(2) 所有屬性或數(shù)量概念都必須借助"&"標注其宿主的類型
關于單位類概念的規(guī)定
(1) 單位通常是指"米"、"公里"、"噸"等,對于中文而言還包含中文所特有的名量和動量
(2) 跟屬性類一樣,除在首位標注的是單位、名量或動量外,還必須借助"&"標注其指向的屬性或事物的類型關于
部件類概念的規(guī)定
第二位標識必須借助于"%"指明其所屬的整體的類型,并盡可能標注它在整體中的部位或它的功能。
【本科論文權威查重軟件有哪些】相關文章:
本科論文查重檢測-查重論文檢測本科10-26
本科論文查重10-05
論文查重本科10-05
本科論文查重怎么查09-30
本科論文免費查重09-30
本科論文怎么查重10-26
本科論文查重檢測10-05
本科論文查重規(guī)則10-06
本科論文查重標準10-06