- 相關(guān)推薦
語料庫語言學(xué)
語料庫語言學(xué)
【摘要】語料庫是語料庫語言學(xué)研究的基礎(chǔ)資源,也是經(jīng)驗主義語言研究方法的主要資源。
語料庫分為很多類型,現(xiàn)在已有相當數(shù)量的語料庫可供語言研究使用。
語料庫語言學(xué)作為語言學(xué)的一個新的分支,當然離不開語料庫。
本文解釋了語料庫語言學(xué)的定義及其內(nèi)涵,介紹了英語語料庫的發(fā)展和現(xiàn)狀,并對語料庫語言學(xué)的未來發(fā)展進行了展望。
【關(guān)鍵詞】語料庫;語料庫語言學(xué);發(fā)展
一、引言
語料庫自從20世紀60年代初出現(xiàn)至今,已經(jīng)經(jīng)歷了半個多世紀的發(fā)展。
隨著計算機技術(shù)的不斷進步,語料庫的研究已經(jīng)不再是某些人的專利。
同時語料庫的發(fā)展也正在以驚人的速度對語言研究的很多領(lǐng)域產(chǎn)生著愈來愈大的影響。
語料庫語言學(xué),是一種基于語料庫的全新的研究技術(shù)和方法。
可以毫不夸張地說,語料庫語言學(xué)開辟了語言研究的一個全新的領(lǐng)域。
本文擬對語料庫的建設(shè),語料語言學(xué)的研究特點,語料庫及語料語言學(xué)的發(fā)展現(xiàn)狀以及存在問題等角度對于語料庫及語料語言學(xué)進行一次梳理。
二、理論回顧
1.什么是語料庫、語料庫語言學(xué)?語料又稱為素材,是自然發(fā)生的語言材料包括書面語和口語的集合。
“可以用來作為描述一種語言的出發(fā)點或用于證實有關(guān)一種語言的假設(shè)的手段”(Crystal,1991)。
語料庫(corpus)亦稱語庫,是存放語言材料的倉庫。
語料庫是收集并科學(xué)地組織起來的語言材料數(shù)據(jù)庫,這種材料是某種語言中自然出現(xiàn)的,可以是書面的,也可以是口頭的(申厚坤,2005)。
通常地講,語料庫就是指為語言研究收集的、用電子形式保存的語言材料,由自然出現(xiàn)的書面語或口語的樣本匯集而成,用來代表特定的語言或語言變體。
2.語料庫及語料庫語言學(xué)的的產(chǎn)生與發(fā)展。
有人認為語料庫研究的發(fā)展經(jīng)歷了三個階段:運用語料庫進行語言研究最早可以追溯到19世紀末,當時的研究手段還只停留在卡片制作和人工檢索的階段,其成果也僅用作編纂語法書或詞典的參考。
20世紀60年代至90年代是語料庫語言學(xué)發(fā)展的第二個階段,世界各地都開始建設(shè)自己的語料庫并且開始跨國聯(lián)合建立國際性的語料庫。
20世紀90年代中期是語料庫語言學(xué)發(fā)展的第三個階段。
但現(xiàn)在被研究者普遍認同的是參照喬姆斯基轉(zhuǎn)換生成語言學(xué)的興衰,認為語料庫語言學(xué)經(jīng)歷了早期發(fā)展、新發(fā)展與復(fù)興三個階段。
3.語料庫語言學(xué)的研究意義。
語料庫語言學(xué)采用數(shù)據(jù)驅(qū)動的實證主義研究方法對自然語言進行統(tǒng)計分析。
對語言、語言交際和語言學(xué)習(xí)的行為規(guī)律進行多層面和全方位的研究。
使語言研究不僅只是對單純語言學(xué)上的符號的描述和解釋,還是對蘊涵著的復(fù)雜社會因素和深刻文化意義的描述和解釋。
4.語料庫語言學(xué)的現(xiàn)狀。
語言界越來越多的人意識到語料在語言研究中的巨大作用。
大批語料庫的建成極大地促進了基于語料研究項目的迅速開展。
語料庫語言學(xué)也正在一起不可替代的巨大優(yōu)勢在語言學(xué)研究中發(fā)揮著越來越無法替代的重要作用。
語料語言學(xué)在以下各方面正被廣泛地運用著。
、僬Z料庫語言學(xué)與詞典編撰。
語料庫語言學(xué)對于詞典的編撰無疑具有極其重要的作用。
稍加留意就可以發(fā)現(xiàn),當代一些對外語教學(xué)有著重要影響的詞典和語法書均是在語料庫的基礎(chǔ)上編寫的。
SEU語料庫建成后,Quick等人合編了堪稱權(quán)威之作的《當代英語語法》(A Grammar of Contempor-ary English),并根據(jù)充實了的語料庫合編了更具權(quán)威的《英語語法大全》(A Comprehensive Grammar of the English Language)。
COBUILD語料庫也以其龐大的庫容、多樣的內(nèi)容作為詞典編纂不可缺少的工具。
、谡Z料庫語言學(xué)與語言研究。
我們無法否認這樣的事實:任何和語言現(xiàn)象有關(guān)的研究都離不開真實的語言素材。
語料庫為應(yīng)用語言學(xué)的研究提供了豐富的語言材料。
語料庫語言學(xué)使得在語言理論、語言史研究和句法、詞法分析及自動語法分析方面得到了充分的應(yīng)用。
再加上語料庫的檢索功能和統(tǒng)計手段給句法研究、語篇分析、會話分析和語音研究提供了方便。
互聯(lián)網(wǎng)上現(xiàn)代英語國際電腦文檔(I2CAME)介紹了許多近年來以語料庫為基礎(chǔ)的語言研究項目,說明語料庫對于語言研究的重大意義。
A.語料庫語言學(xué)與外語教學(xué)。
毫不夸張地說,語料庫和語料庫語言學(xué)的應(yīng)用已經(jīng)滲透到語言教學(xué)的各個角落。
許智堅將語料庫語言學(xué)在外語教學(xué)中的應(yīng)用總結(jié)為如下六點:a.幫助減少課堂上教的與人們實際上正在使用的語言之間的差距;b.發(fā)現(xiàn)過去被忽略的語言規(guī)律;c.幫助我們更清楚地認識各種語域變體的特點;d.幫助我們更準確地理解一些詞語在實際交際中的意義和用法;e.幫助發(fā)現(xiàn)學(xué)習(xí)者使用語言時的問題;f.測試及語言錯誤分析等方面。
在計算機輔助教學(xué)中語料庫語言學(xué)能在教學(xué)中發(fā)揮更大的作用。
B.語料庫語言學(xué)與翻譯。
語料庫語言學(xué)與翻譯的結(jié)合起步相對較晚,至今只有十多年的歷史。
兩者的結(jié)合源于國外對翻譯學(xué)的研究。
應(yīng)用于翻譯中的語料庫多是平行語料庫,由相對應(yīng)的兩種或多種語言構(gòu)成的文本組成。
、壅Z料庫語言學(xué)的其他運用。
此外,語料庫語言學(xué)也在其他一些領(lǐng)域起了一定的作用,比如有力地推動了計算機語言學(xué)的發(fā)展,主要表現(xiàn)在語料處理工具的研究、機器翻譯及話語識別和話語合成等方面。
5.語料庫語言學(xué)存在的問題。
、僬Z料庫語言學(xué)的地位問題。
語料庫語言學(xué)的地位到底怎么定義,這一直以來有些爭議。
尤其是語料庫語言學(xué)被引進中國以來,這種地位問題的討論就一直沒有停止過。
劉滿堂、潘永樑等人所持觀點為:語料庫語言學(xué)是一門新興而獨立的語言學(xué)分支學(xué)科。
黃昌寧、丁信善、許家金等人則持相反觀點。
他們甚至提出用基于語料庫的研究方法可能更適合于反映語料庫語言學(xué)的地位和性質(zhì)。
、谡Z料庫建設(shè)的問題。
收集語料時的文本形式、文本所有權(quán)和版權(quán)等的問題也不容忽視。
再加上不同語料庫的注釋采用的編碼系統(tǒng)不完全相同或很不相同,為信息交換和基于語料庫的語言研究帶來很大的困難。
另外,機器可讀語料庫中的語篇仍有版權(quán)限制,還有語料的時限問題,這些都是語料語言學(xué)進一步發(fā)展所必須面對的問題。
③語料庫語言學(xué)的發(fā)展問題。
李文中(2010)指出語料庫語言學(xué)的發(fā)展至少有如下四個問題亟待解決:A.語料庫開發(fā)問題。
語料庫開發(fā)正在向兩頭快速發(fā)展和延伸:一是通用型的、基于網(wǎng)絡(luò)的超大型語料庫開發(fā);二是個性化、專門化、行業(yè)化的小型語料庫開發(fā)。
這兩種開發(fā)的方向各有其優(yōu)勢,到底哪種開發(fā)方向應(yīng)該占據(jù)優(yōu)勢,還是兩種發(fā)展方向各自為戰(zhàn),又亦或是兩者相結(jié)合發(fā)展,確實也是需要考慮的問題。
B.語料庫研究的發(fā)展問題。
語料庫研究需要更大的發(fā)展縱深,要解決如何從描述到解釋,以及如何從發(fā)現(xiàn)到理論建構(gòu)等難題。
C.語料庫研究方法和視野問題。
語料語言學(xué)是集中于實踐性研究,偏廢理論建構(gòu)式的研究,還是也需要在理論建構(gòu)上有所建樹?研究的視角僅僅局限于教學(xué)和語言習(xí)得,還是不斷的拓展其研究領(lǐng)域以擴大其影響力?這也是問題。
D.語料庫研究應(yīng)用問題。
語料庫研究應(yīng)用越來越多元化和日;
到底如何將語料庫的研究成果更加充分的應(yīng)用起來,應(yīng)該引起足夠的重視。
但目前最大問題可能是只有一小部分語言研究專家掌握語料庫研究方法,絕大多數(shù)語言教師和語言學(xué)習(xí)者不了解語料庫,不會使用語料庫,更不懂如何運用語料庫資源進行科學(xué)研究。
三、結(jié)語
近幾年來在計算語言學(xué)和語言信息處理領(lǐng)域的學(xué)術(shù)會議上,語料庫的建設(shè)和應(yīng)用一直是重要論題之一。
縱觀其討論的重點主要集中在基于語料庫的語言分析方法,以及語料的標注、管理和規(guī)范等問題上。
語言學(xué)家更多關(guān)心的是語料庫的規(guī)劃和建設(shè),語料庫方法在語言研究和教學(xué)中的應(yīng)用。
(傅愛平)現(xiàn)階段,語料庫主要用于語言描寫,為詞典編纂、教材編寫、語言教學(xué)提供實際語例,幫助語言學(xué)家揭示語言的詞匯、語法、語義和語用規(guī)律。
我們堅信,語料庫語言學(xué)將會廣泛地應(yīng)用于語言學(xué)研究的各個領(lǐng)域,不僅僅為外語教學(xué)、詞典編纂、教材編寫等開辟新的道路,更會在其他不同的更為廣泛的應(yīng)用語言學(xué)的領(lǐng)域里大放光彩。
參考文獻:
[1]丁信善.語料庫語言學(xué)的發(fā)展及研究現(xiàn)狀[J].當代語言學(xué).北京:1998(1)4-12.
[2]桂詩春.發(fā)展我國應(yīng)用語言學(xué)的幾點想法[J].語言文字應(yīng)用.北京:1998(1):11.
[3]何安平.學(xué)習(xí)者語料庫與外語教學(xué)[J].國外外語教學(xué),1999(4).
[4]馮志偉.中國語料庫研究的歷史與現(xiàn)狀[J].漢語語言與計算學(xué)報,2002(1).
[5]顧曰國.語料庫與語言研究當代語言學(xué)[J].1998(1).
【語料庫語言學(xué)】相關(guān)文章:
認知語言學(xué)的語言學(xué)基礎(chǔ)論文范文10-05
英語語言學(xué)論文11-14
語言學(xué)及應(yīng)用語言學(xué)專業(yè)應(yīng)屆生的求職簡歷范文10-06
網(wǎng)絡(luò)語言的社會語言學(xué)10-26
c語言學(xué)習(xí)心得11-05
中班語言學(xué)科工作總結(jié)11-19
語言學(xué)期工作總結(jié)01-07
關(guān)于新西蘭語言學(xué)習(xí)技巧簡介10-07
中班語言學(xué)好樣教案反思10-07
意大利語言學(xué)習(xí)技巧淺析10-07