《超越学科的认知基础》2015秋顧學雍学习报告-第五周
理解可被分为三类譬喻
关键词
本文
在10月21日的课堂中,有同学问道:“何谓理解”?我回答:
"根据Metaphors We Live By一书的内容,我们可以推论,理解可以被分类为三种譬喻,如果大家读了Lakoff的Where Mathematics Comes From,这个基于譬喻的认知理论就更加明确了"。
我选这一本书作为参考文献,其目的就是希望同学们可以把认知的细节内容,更加明确地分辨为可以用特定词汇记录的子类别。这对思维的形式化,或分享知识的过程,具有操作性的价值。接下来,韩峰老师问大家:"下周我将介绍熵的概念,大家对这个词有多少理解?" 马上有同学回答:
"什么是理解?"
韩老师要求同学们用一句话解释熵的定义。有同学回答:“混乱的程度”。我说:这个就是把混乱的概念当做熵的本体譬喻对象,如果把熵当做度量衡,那么就可以找到其强弱高低的空间譬喻,若是能说明熵的计算方式,那么就是对结构性的譬喻有所了解。换言之,理解的层次,可以用不同类型的譬喻关系来衡量。这对分享知识与度量知识的理解程度有操作性意义。教师可以根据选用譬喻的结果来判断学生是否"理解"某个层次的概念。我认为Lakoff的重大贡献,就是提出了一套分类认知层次的方法,也就是一种分辨理解层次的方法。
第五周课堂讨论的重心
我希望同学们从这一周开始,能够开始在阅读、聆听演讲、或是发表言论时,注意到符号选用或是遣词用字的恰当性。分辨恰当性的程度,可以根据譬喻的类别,以及譬喻的正确性,从本体(Ontological), 结构(Structural),以及空间配置(Orientational)的正确性来分析。这是一个适用于很多范围的认知基础。我暂时还想不到这三类譬喻之外的类别,我认为这个分类的完备性,来自语言体系的分类完备性。我把本体的知识内容,当做是一个词汇库,也就是一个大的命名空间,而结构譬喻,就是在两个本体对象之间的组成结构的对应性,又回到命名空间的具体对象的联系,而空间配置的正确性,就是时间前后与空间大小、远近、速度快慢的差异性。这些都是可以拆解为可以客观判断的逻辑结论,所以对知识管理,特别是群体知识管理,具有很基础的运用价值。我认为同学们必须掌握这个对譬喻分类的思考习惯,这个分类过程,可以用来检验平时遣词用字与用图形表达个人想法的正确性。
vForm的科技展示
我们在第一小节,让Stephen Young博士,展示了他创造的vForm。这个用平板电脑撰写笔记的应用软件,可以同时涵盖三种譬喻的信息内容。让使用者随意涂写的文字和图像,代表了Ontological Metaphor, 不同页面之间的联系,可以是从属,延伸,临近,上下左右等Orientational Metaphors,而继承,传递,链接性等页面关系,可以当做一些常用的Structural Metaphors。我请Young來的目的,就是要展现,知识的记录与管理,可以经由多种人机互动界面,用数字化的工具采集知识内容之间的关系,然后,可以根据不同类别的譬喻关系,分析由人,甚至于一个巨大的人群所理解的知识内容,从而建立一个让人与人群可以记录与分享“理解”内容的知识库。根据Young的人机界面设计,我们可以直观地看到一个互动化的知识地图的软件雏形。
在Young介绍完他的创作之后,我很简短地展示了我在研读博士学位时期的元语言集成开发环境,又可称之为Object-Process Network Integrated Development Environment,或OPN-IDE。这个元语言的开发工具,就是要反映如何"理解"知识和对不同类别的知识进行计算的理念。十年前,我开发这套系统时,就是为了证明,知识可以被分为几种可计算的类别,而每一种类别会有一个特别适合于表达或记录该类型知识的数据结构。当多种知识被记录在一套标准化的知识表达框架之下,一个可以同时收录,并联合多种知识内容的计算环境,就可以根据这些知识的内容,自动产生相当可观而实用的“设计”方案。设计方案的细节与丰富性,就跟计算系统所收容的理解内容的数量,以及计算机推论不同类别的数据内容的计算机制有关。理论上来说,很大一部分的工程分析与科学研究的基础技术活,可以被这个系统,大规模地自动化。我认为这个概念,到今天还是一个富有重大研究机会的领域。因为当时的一个研究的障碍,是大量数据的采集与管理,需要专业而长期的技术与团队积累。通用化的知识库和廉价的计算服务还是不便于个人研究团队使用。而今天的情况跟十年前是完全不同了。同学们可以想象,在2005年,我博士刚毕业的时候,大数据还没有成为一个流行的名词。到了2015年的今天,开源的软件,高速而开放的实时数据服务,低价,甚至免费的计算服务,在互联网上,已经到了唾手可得的状态。这个研究方向,又开始有了新的转折点。
我们现在使用的维基词条平台,可以采集各种知识的内容,但是这些内容的可计算性,在自然语言处理技术日趋成熟的情况下,可以被当做一个普适性的知识采集工具。但是,对于如何检验这些内容的正确性,甚至对不同内容的可信度,做出普适性的计算评估框架,仍然是一个难题。我认为,将大量的数字化知识内容整理成为内容本体,用可规模化执行的命名空间筛选算法,再根据几种不同类别的譬喻的结构化联系,应该可以持续地修正一个可供人群和计算机参考的公共知识地图。换言之,我们可以在互联网上创造一个让人、计算机、动植物、与传感器网络,可以互动交流的知识地图。
知识地图的数据储存格式
目前,同学们编写维基词条的人机界面是一个网页的文字编辑表格,在网络的另一端,所有的文字内容是存放在一个关系数据库的信息格式中。这个格式的信息数据,对于建立可动态搜寻的知识地图,有很多不太合拍的技术问题。所以,我找到了一个开源的数据库,Neo4j, 可以把维基的各种信息,转化成为一个网络化的信息储存格式,有利于动态地搜寻并筛选知识地图。同学们也应该知道有这种数据库技术的存在。
知识搜索的障碍
在与同学讨论知识获取的过程中,我发现同学们对搜寻信息有很多障碍。这些障碍一部分来自信息搜索结果的排列或筛选方式,例如,谷歌搜索,把相关网站链接的相关性,用一个列表排序的方法展示,这种关联性的Orientational Metaphor,不见得是最适合展示相关文件的方法。所以用网络,甚至是动态的网络的人机界面来展示相关网站或文件,就变成了一类引导搜寻方向的新工具。同学们可以下载Neo4j数据库,并根据它的展示数据,看看这类数据库是否能处理Structural Metaphors的搜寻,以及其网络图形的动态布局功能,是否能提供基于Orientational Metaphor的信息筛选功能。大家也要记得,关键字词的语意,图形标示的大小与形状,都可以当做是某种Ontological Metaphor。换言之,我们是否能用一些信息工具的组合,来建立一个可以用来储存,并且筛选尽可能大范围的所有知识内容,从而提供一个可以发布到全球使用者的公用知识地图,就是我们这个课程的长期研究目标。换言之,超越学科的认知基础,不但有理论本体,内容组织,还应该有工具的支撑。
参考文献
Neo4j开源网络数据库 最近连接时间:October 22, 2015