语言之外 | BaBaLiBoo

维特根斯坦有句名言

The limits of my language mean the limits of my world.

我语言的边界就是我世界的边界

这是我过去认同且喜欢的一句话。人不是赤裸地面对世界的，人总是通过语言进入世界。当一个人的语言匮乏，无法清晰地表达自己的情绪与想法，他就很难被别人理解，也很难被纳入讨论、制度和共识。同时，语言的清晰度也决定着你对世界的清晰度，如果一个人的感受始终没有语言去描述、区分和反思，那他的世界往往也会处在一种粗糙、模糊、混沌的状态里。

但当我开始细细思索这句话，似乎也不是完全正确。

不可言说的东西，并不等于不存在于我的世界中。 除了我们可以用语言表达的部分，人类有很多细腻、微妙、不可言说的感受和情绪，他们难道在我的世界之外吗，那样世界之外就是可知的了，这说不通。人并不是先说出悲伤，才感到悲伤，这些不可言说的东西不能被充分语言化，但仍然真实地属于我的经验世界，他们只是先于表达、溢出表达。语言像是姗姗来迟的解释，而不是经验本身的起点。语言限制的是可清晰表达和公共讨论的世界，而不是全部经验世界。

语言天然会把连续的世界离散化。 我们在使用语言时，总是习惯于对复杂多维的世界进行简化、提炼和切分。人类常用二分法来描述事物，比如用左派和右派去划分政治立场，用i人和e人去描述性格等等。然而世界在很多维度都是连续的而非离散的，比如判断一个人是否患有糖尿病，看似只有两种状态，实则是在连续分布的血糖值上根据设定的阈值来划分；人格倾向也是连续分布的百分比，却常常被日常语言压缩成“i人”或“e人”。如今大语言模型的发展让我更加强烈地意识到这点。AI存在于连续的向量空间之中，当你给模型一张图问它是猫还是狗时，它看似输出了猫，实际内部判断却不是这么工作的，可能是70%概率的猫和30%的狗，只是为了回应人类语言的提问，把高维连续的判断压缩成了一个离散的语言标签——猫。

语言看起来是清晰分类，底层却可能是模糊、渐变、重叠的。语言不是世界本身，也并非对世界透明地映照，语言呈现出来的世界已经是被简化、提炼、压缩过的版本。因此语言的边界也不是全部世界的边界，而是你能够清晰理解、反思、交流的世界边界。

人类并非天然生活在清晰的概念里，我们只是不得不借助概念去表达自己。可一旦说出来，那些原本连续流动的感受就会被切割、被命名、被归类，最后变成一个看上去确定无疑的答案。我们说“我爱你”“我难过”“我讨厌他”“我属于i人”，可是这些句子背后，往往都藏着远比词语本身更复杂的东西。语言像一个接口，把本来丰富而混杂的内部世界，翻译成了外部可以接收的形式，让我们可以沟通，也不可避免地失真。如史铁生所说，“有些事只适合收藏。不能说，也不能想，却又不能忘。它们不能变成语言，它们无法变成语言，一旦变成语言就不再是它们了。它们是一片朦胧的温馨与寂寥，是一片成熟的希望与绝望，它们的领地只有两处：心与坟墓。“