當前位置:歷史故事大全網 - 歷史上的今天 - 幫助查找Word的發展歷史、特點、使用技巧等信息。

幫助查找Word的發展歷史、特點、使用技巧等信息。

世界發展概況

關於WordNet不成熟的想法可以追溯到20多年前,1985之後想法才開始逐漸具體化和明晰化。自1985年以來,WordNet作為壹個知識項目已經如火如荼地開展起來。但是,當時的WordNet和10多年後的今天的WordNet已經大不相同了。

這個項目最初的前提之壹是“可分性假說”,即壹種語言的詞匯成分可以被分離出來,並專門針對它進行研究。詞典編纂的歷史清楚地告訴我們,可以在詞匯層面獲得有用的研究成果。詞匯當然不是完全獨立於其他語言成分,但它可以從其他成分中分離出來。例如,雖然語音和語法知識是在早期生活中形成的,但詞匯量可以隨著智力活動的不斷積累而增加。這說明語言的不同成分涉及不同的認知過程。

另壹個前提是“模式假說”:壹個人不可能掌握使用壹種語言所需要的所有單詞,除非他能利用系統的模式和意義之間的關系。至少從柏拉圖的時代起,這種系統的心智模型就是壹種思辨的知識,現代語言學研究已經開始在自然語言的語義結構中確定這樣壹種模型。然而,許多沿著這條路線的優秀研究工作在這個問題上遇到了困難。壹個作者可能會提出壹個語義理論,並以20到50個英語單詞為例來展示他的理論,留下另外654.38+百萬個單詞供讀者實踐。

第三個前提是所謂的“全面性假設”:計算語言學要想像人類壹樣處理自然語言,需要存儲盡可能多的詞匯知識。

建立包含詞義描述的大規模敘詞表的方法之壹是基於語義成分分析(也可譯為義素分析)的成分詞匯語義學方法。這樣,壹個詞的意義被分析成更小的概念原子的組合。然而,定義壹組概念原子並不容易。事實上喬治。WordNet的主教練A.Miller在他與Philip N. Johnson-Laird於1976年合作的《語言與知覺》壹書中也探討了義素分析的語義描述方法,但直到1985年,他仍然未能拿出壹個完整的、定義明確的清單,在上面列出所有的概念原子。

到1985,很多認知心理學家和計算語言學家開始用“網”的形式來描述詞的意義。比如“桌子”和“家具”代表兩個節點,這兩個節點之間有壹個鏢來表達桌子是壹種家具的命題,即“是-壹種-的”語義關系。隨著這方面研究的增多,越來越多的人有意識地認識到,除了語義成分(義素分析),關系也可以用來表達語義(關系詞匯語義學),而且後者有可能取代前者。

在WordNet早期,研究人員主要考慮的是關系語義能否大規模廣泛應用,而不是僅僅停留在玩具演示的層面。當研究人員確信這是可行的時,他們編寫了應用軟件,將想法變成現實。事實上,在早期,米勒並沒有壹個完整的關於建立大型詞庫的想法。初步的想法是識別由字符串組成的最重要的詞節點,並探索它們之間的語義關系模型。當時的想法是,如果獲得了正確的語義關系模型,就可以從中推斷出詞的定義。因此,對於壹個關於詞義的關系網絡來說,詞義的定義是多余的。

在1978中,米勒描述了“自動化詞典”的想法。但當時,他完全不知道如何實現這個想法。多虧了斯隆基金會、斯賓塞基金會和IBM的沃森研究中心的支持,米勒才得以壹直保持自己的想法,沒有半途而廢。到1984,米勒甚至在IBM PC上做了壹個45個名詞的小型語義網,他稱之為“詞網”。Miller在IBM和Bellcore展示了這壹成果。他在Bellcore的朋友Lance Miller,Roy Byrd,Michael Lesk,Donald Walker,Robert Amsler和Stephen Hanson鼓勵他繼續下去,並給了他許多實用的技術指導。

Lesk邀請Miller參加6月加拿大滑鐵盧大學新牛津英語詞典中心第壹次會議1985 11。米勒提交了壹篇論文。在那篇論文中,Miller解釋了這樣壹種思想,我們可以用壹個同義詞集來表示詞匯概念,描述詞匯矩陣,也就是在詞的形式和意義之間建立壹種映射關系。事實上,這是WordNet開發中指導研究工作的主要思想。

不過,也許米勒在那次會議上的報告中介紹的觀點還是第二位的,報告的標題更有意義。這個標題是由Lesk提出的,叫做:WordNet:壹個字典瀏覽器。WordNet:詞典瀏覽器。在這裏,WordNet被視為詞典瀏覽器,是機器可讀詞典的輔助工具。但是,這樣的機器詞典傳統上不是按字母順序排序,而是根據意義排序。

也就是WordNet初具規模的時候,米勒和壹些誌同道合的同事在普林斯頓聯合發起了壹個認知研究的項目。理查德·卡林福德在1983到1985訪問普林斯頓。他、吉爾伯特·赫爾曼和米勒說服教務長尼爾·魯登斯廷提供壹臺微型計算機。這臺計算機成了普林斯頓認知科學實驗室的核心。有了這些設備,米勒說服了海軍研究辦公室的蘇珊·奇普曼與他們簽訂合同,開發WordNet。科林福德和米勒從陸軍研究所獲得了壹份合同,開發詞匯語義的計算理論。1986年3月,詹姆斯·S·麥克唐納基金會向普林斯頓大學慷慨捐款,支持認知科學的研究工作。Marie Bienkowski(Cullingford的研究生)和壹位熟練的計算機專家從1985開始就和我們壹起工作,很快他們就拿出了我們需要的軟件。由此,WordNet真正成為普林斯頓新成立的認知科學實驗室的幾個研究項目之壹,並開始在實踐中運作。

用來創建WordNet的最重要的程序是所謂的Grinder程序。Bienkowski在1986年用LISP語言編寫了Grinder的第壹個版本。丹·泰貝爾在1987用C語言重寫了這個程序。安東尼奧·羅梅羅在1989又重寫了壹遍。Randee Tengi從1991開始負責管理程序的所有這些版本。

WordNet中的單詞來自不同的地方。布朗語料庫、勞倫斯·厄當的《同義詞和反義詞小詞典》(1978)、厄當修訂的《羅代爾同義詞詞典》(1978)、羅伯特·查普曼的《羅傑斯同義詞詞典》第4版(1977)等。1986下半年,米勒從海軍研究與發展中心的Fred Chang那裏得到了壹個詞匯表。Miller將Chang的詞匯與WordNet現有的詞匯進行了對比,令人沮喪的結果是只有15%的重疊詞,於是Miller將Chang的詞匯加入了WordNet。1993年,米勒得到了紐約大學Ralph Grishman和他的同事們的39143個單詞的詞匯表,它實際上被收錄在著名的COMLEX字典中。這個比較的結果是WordNet只包含COMLEX中74%的單詞。所以米勒把這個詞匯加入了WordNet。

隨著詞匯量的增加,組織工作的壓力開始增加。第壹步,通過句法類別進行區分。我們創建了不同的文件來存儲名詞、動詞和形容詞(副詞是在1992之後添加的)。但是每個句法類別的詞還是太多,不進壹步分類很難掌握。名詞是最嚴重的問題,因為它們是開放的詞類。

1987年春天,菲利普·n·約翰遜-萊爾德(Philip N. Johnson-Laird)從英國劍橋應用心理學研究所訪問普林斯頓大學。他發現WordNet缺乏區分形容詞修飾不同名詞時詞義變化的手段。他用了266對反義詞形容詞(當時收錄在WordNet中)按照修飾名詞的合適性對名詞進行分類。結果共獲得25個名詞小類。這些小類構成了名詞的基本分類。而且這些不同子類的名詞還被分成不同的個體文件,交給不同的研究者分別處理,從而促進了WordNet在工程上的進步。

1987年夏天,Christiane Fellbaum加入研究團隊,承擔了動詞的次分類工作。

描述性形容詞,Kitty Miller是唯壹的壹個,從壹開始就壹直是壹個大類,沒有次分類,所有這些形容詞也保存在壹個巨大的文件中。

Wordnet從壹個簡單的詞典瀏覽器發展到壹個自成壹體的詞匯數據庫,主要的進步是從1989開始的。當時SusanChipman對WordNet僅僅作為壹個詞匯瀏覽器並不滿意,要求研究團隊開發壹個工具。這個工具可以讀取基於WordNet的文本,並報告文本中單詞的各種信息。這個工具叫做“單詞過濾器”。可以從小說文檔中過濾掉生僻字或不需要的字,而用更常見的字來代替這些字。這部作品很快讓我們意識到,我們必須處理詞形的曲折變化。這使我們處理壹些關於詞形的問題。WordNet只包含單詞的基本形式。如果“ships”出現在文本中,WordNet無法識別它。Richard Beckwith和Miceael Colon編寫了壹個名為Morphy的程序,它可以識別文本中的單詞“ships”。到1989年9月,WordNet可以處理文本中的詞法變化,在詞庫中找到相應的單詞基本形式。

上述工作導致了另壹個重要的進展,即在文本中將單詞與WordNet中相應的含義相關聯。Claudia leak ock(1991年11月)和Brian Gustafson開發了壹個interface - ConText,可以對文本進行預處理(實例化、詞匯化、自動句法標註等。)並和WordNet壹起顯示目標詞(即語義標註目標詞)。1993年6月,Shari Landes負責編寫了壹套註釋工具(包括壹套標簽)。有了這樣的工具,可以盡可能地輸出壹個明確的文本。文本的語義標註顯著提高了WordNet的覆蓋率,包括詞匯覆蓋率和詞義覆蓋率。

WordNet的另壹個重要變化發生在1989年的春天。Antonio Romero修改了Grinder程序,使其可以接受括號的定義(或者理解為“註釋”)作為同義詞集的壹部分。隨著WordNet中單詞數量的增加,在保持同義詞集純度的同時盡可能清晰地區分詞義變得越來越困難。換句話說,僅僅用同義詞來定義壹個詞的意思是不夠的。起初,WordNet盡量保持評論簡短。但是壹年後,評論開始越來越長。註釋的數量也開始穩步增加。1989年4月,WordNet有37409個同義詞集,無註釋;到1991年7月,WordNet包含了44983個同義詞和13688個註釋(30%)。到6月1992 1,WordNet包含了49771個同義詞集和19382個註釋(39%)。到1993年6月,WordNet包含了61023個同義詞集和36880個註釋(60%)。到6月1994 1,WordNet包含了79542個同義詞集和58705個註釋(74%)。到6月1995,65438+10月,WordNet收錄了91050個同義詞集,75389個註釋(占同義詞集的83%)。

WordNet的研究人員壹直將WordNet視為壹個實驗,而不是壹個產品。所以當WordNet中有足夠多的單詞時,他們免費向學術界開放WordNet。Randee Tengi監督了WordNet壹系列版本的發布。Wordnet版本1.0發布於1991年7月;1.1版本發布於1991的8月;1.2版本發布於1992年4月;1.3版本發布於1992年2月;1.4版本發布於1993年8月;1.5版本發布於1995年3月。目前,超過1000個人和組織加入了WordNet郵件列表。許多研究人員下載了WordNet並以不同的方式使用它。

WordNet得到了海軍研究辦公室、高級研究計劃局、詹姆斯·s·麥克唐奈基金和最近的語言數據聯盟的資助。

Word的主要功能和特點

Word == >的主要功能和特點;Word的開始和退出

-

Word的主要功能和特點可以概括如下:

(1)所見即所得。用戶使用Word軟件排列文檔,使打印效果在屏幕上清晰可見。

(2)直觀的操作界面Word軟件具有友好的界面,並提供了多種工具。可以用鼠標完成選擇、排版等操作。

(3)多媒體混合排版可以用Word軟件編輯文字、圖形、圖像、聲音、動畫,也可以插入其他軟件制作的信息。還可以使用Word軟件提供的繪圖工具制作圖形,編輯藝術化的文字和數學公式,可以滿足用戶的各種文檔處理需求。

(4)強大的制表功能Word軟件提供了強大的制表功能,不僅可以自動制表,還可以手動制表。Word表格行自動保護,表格中的數據可以自動計算,表格也可以用各種方式修飾。在Word軟件中,也可以直接插入電子表格。用Word軟件做表格簡單美觀,快捷方便。

(5)自動功能詞軟件提供拼寫和語法檢查功能,提高了英文文章編輯的準確性。如果發現語法錯誤或拼寫錯誤,Word軟件還會提供修改建議。用Word軟件編輯壹篇文檔後,Word可以幫助用戶自動撰寫摘要,節省用戶大量時間。自動更正功能為用戶輸入相同的字符提供了很好的幫助。用戶可以自己定義字符的輸入。當用戶想要輸入相同的字符時,可以改為定義壹個字母,尤其是在輸入漢字時。這個功能大大提高了用戶的輸入速度。

(6)模板和向導功能Word軟件提供了大量豐富的模板,使用戶在編輯某壹類文檔時能夠快速建立相應的格式。而且Word軟件允許用戶自定義模板,為用戶建立有特殊需求的文檔提供了壹種高效快捷的方法。

(7)豐富的幫助功能Word軟件的幫助功能詳細而豐富,Word軟件提供的形象、便捷的幫助使用戶在遇到問題時能夠找到解決方案。為用戶自學提供了方便。

(8)支持互聯網的網絡工具是當今計算機最廣泛使用和最流行的方面之壹。Word軟件提供網絡支持。用戶可以根據網頁向導快速方便地制作網頁(通常稱為網頁),也可以使用Word軟件的Web工具欄快速打開、查找或瀏覽包括網頁和Web文檔在內的各種文檔。

(9)超強兼容性Word軟件可以支持多種文檔,還可以將Word編輯的文檔保存為其他格式,為Word軟件與其他軟件的信息交換提供了極大的便利。妳可以編輯電子郵件、信封、備忘錄、報告、網頁等。用詞。

(10)強大的打印功能Word軟件提供打印預覽功能,對打印機參數有很強的支持和配置。

  • 上一篇:《西楚霸王》影評
  • 下一篇:負責任的同義詞(換句話說)
  • copyright 2024歷史故事大全網