圖書館和信息科學中最常用的檢索語言是自然語言。自然語言是取自文獻信息的實際語言,不需要標準化。取的logo字直接取自情報信息本身的字。
自然語言處理(NLP)是指機器理解和解釋人們書寫和說話方式的能力。
NLP的目標是讓計算機/機器在理解語言方面像人類壹樣智能。最終目標是在人類交流(自然語言)和計算機理解(機器語言)之間架起壹座橋梁。
自然語言處理是人工智能的壹個子領域。自然語言處理的應用包括機器翻譯、情感分析、智能問答、信息抽取、語言輸入、輿情分析、知識圖譜等,也是深度學習的壹個分支。
在這個概念下有兩個子集,即自然語言理解(NLU)和自然語言生成(NLG)。
套用壹張百度的圖片,把他們的關系展示如下。
(1)底層是最基礎的大數據,機器學習,語言學;
(2)向上看,是知識圖,包括實體圖、關註圖和意向圖。
(3)下壹個層次,左邊是語言理解,右邊是語言生成。
-語言理解,包括查詢理解、文本理解、情感分析等。以及不同層面的詞匯、句法和語義分析。
——語言生成,包括寫作、閱讀理解等。
(4)最頂層,是系統層,包括問答系統、機器翻譯和對話系統。