语言之外
维特根斯坦有句名言
The limits of my language mean the limits of my world.
我语言的边界就是我世界的边界
这是我过去认同且喜欢的一句话。人不是赤裸地面对世界的,人总是通过语言进入世界。当一个人的语言匮乏,无法清晰地表达自己的情绪与想法,他就很难被别人理解,也很难被纳入讨论、制度和共识。同时,语言的清晰度也决定着你对世界的清晰度,如果一个人的感受始终没有语言去描述、区分和反思,那他的世界往往也会处在一种粗糙、模糊、混沌的状态里。
但当我开始细细思索这句话,似乎也不是完全正确。
不可言说的东西,并不等于不存在于我的世界中。 除了我们可以用语言表达的部分,人类有很多细腻、微妙、不可言说的感受和情绪,他们难道在我的世界之外吗,那样世界之外就是可知的了,这说不通。人并不是先说出悲伤,才感到悲伤,这些不可言说的东西不能被充分语言化,但仍然真实地属于我的经验世界,他们只是先于表达、溢出表达。语言像是姗姗来迟的解释,而不是经验本身的起点。语言限制的是可清晰表达和公共讨论的世界,而不是全部经验世界。
语言天然会把连续的世界离散化。 我们在使用语言时,总是习惯于对复杂多维的世界进行简化、提炼和切分。人类常用二分法来描述事物,比如用左派和右派去划分政治立场,用i人和e人去描述性格等等。然而世界在很多维度都是连续的而非离散的,比如判断一个人是否患有糖尿病,看似只有两种状态,实则是在连续分布的血糖值上根据设定的阈值来划分;人格倾向也是连续分布的百分比,却常常被日常语言压缩成“i人”或“e人”。如今大语言模型的发展让我更加强烈地意识到这点。AI存在于连续的向量空间之中,当你给模型一张图问它是猫还是狗时,它看似输出了猫,实际内部判断却不是这么工作的,可能是70%概率的猫和30%的狗,只是为了回应人类语言的提问,把高维连续的判断压缩成了一个离散的语言标签——猫。
语言看起来是清晰分类,底层却可能是模糊、渐变、重叠的。语言不是世界本身,也并非对世界透明地映照,语言呈现出来的世界已经是被简化、提炼、压缩过的版本。因此语言的边界也不是全部世界的边界,而是你能够清晰理解、反思、交流的世界边界。
人类并非天然生活在清晰的概念里,我们只是不得不借助概念去表达自己。可一旦说出来,那些原本连续流动的感受就会被切割、被命名、被归类,最后变成一个看上去确定无疑的答案。我们说“我爱你”“我难过”“我讨厌他”“我属于i人”,可是这些句子背后,往往都藏着远比词语本身更复杂的东西。语言像一个接口,把本来丰富而混杂的内部世界,翻译成了外部可以接收的形式,让我们可以沟通,也不可避免地失真。如史铁生所说,“有些事只适合收藏。不能说,也不能想,却又不能忘。它们不能变成语言,它们无法变成语言,一旦变成语言就不再是它们了。它们是一片朦胧的温馨与寂寥,是一片成熟的希望与绝望,它们的领地只有两处:心与坟墓。“





