从形式语言学家角度来看:一门语言是一些句子的“集合(set)”,每个句子是“符号(symbol)”的“序列(sequence)”;不用考虑意义、结构,一个句子要么属于该语言,要么不属于。符号(symbol)唯一的属性就是它有特定的ID;任意语言都有特定数量(且是有限数量)的符号,如字母。
- 序列(sequence):指的是每个句子中的符号的顺序是确定了,不能改变
形式语言学家也称一个句子(sentence)为单词(word),例如他会说“单词 ab 在语言 {a, b, ab, ba}”。
对于计算机科学家来说,一门语言可能是一个无穷大的句子的集合,每个句子由记号按特定结构组合起来;记号和这种结构一起组成了句子的语义(semantics),你也可以将其称为句子的“意义(meaning)”。在前面形式语言学家对于语言的观念中,我们引入了两个新的东西:结构(structure)和语义(semantic)。对于计算机科学家来说,“3+4*5”是语言“单个十进制数字的算术运算”中的一个句子,你可以通过加入括号来展示其结构如“(3+(4*5))”,而其语义可能就是 23 了。
对于语言学家来说,必须得承认他们眼中的语言要平凡的多:一门语言是可能相关的所有句子的集合。句子有特定结构,单词有实际意义。词语和句子结构一起构成了句子的意义,理解这种意义是我们得以沟通的基础。单词,由字母组成,也有特定结构;这些字母组合的特定结构赋予了单词意义。