主办单位:中国物品编码中心 | 中国自动识别技术协会 | 《中国自动识别技术》杂志社

设为首页 | 加入收藏 | 关于我们

  特别报道  正文

物品分类——兼论丑小鸭定理的思考

发布时间:2024年03月26日 来源:中国自动识别网 作者:韩树文

导语: 作为人类认识自然、认识世界的一部分,物的分类从人类文明诞生之初就伴随着人类并且逐渐演化到现在。

 人对物品的分类是功利的,并不客观,根源在于人对物品分类的目的是管理并利用物品。所以物品的分类实际上体现的是人管理物品的要求,分类是具有管理属性的,也可以说分类就是管理。

分类法是人类认识物品和物品所在世界的一种普遍而重要的方法。分类可以将复杂的问题简单化。作为人类认识自然、认识世界的一部分,物的分类从人类文明诞生之初就伴随着人类并且逐渐演化到现在。随着人类心智的发展,世界万事万物的变化反映在人们的意识中。人们为了理解和认识世界上的万事万物,开始对事物进行分门别类,这个过程就是物品辨识的过程,也就是说,人们理解物的性质和作用是通过鉴别其属性实现的。
 
什么是物品的分类
人们有一个关于物品分类的基本共识,那就是分类是找出物品属性之间的相似性,或者说是找出物品属性之间的差异性。找到相似性,物品就可以分为一个类别;找到差异性,物品就可以分在不同类别。两个物品划分在同一个类别,就说明这两个物品有足够多的相似性。因此,有足够多相似性的物品可以被放在同一个类别里面。比如我们有N1、N2……Nj种不同的分类依据,物品A和物品B如果同时具有N1规定的属性,那么在N1的属性约束下,我们把物品A和物品B放在同一个类别,并且认为物品A和物品B同属一类;如果物品A和物品B不同时具有N1这个属性,那么就把物品A和物品B放在两个不同的类别,并且认为物品A和物品B不属于同一类。如此下去,物品A和物品B被放在一类的次数就决定了物品A和物品B之间相似度的高低。
丑小鸭定理概述
丑小鸭定理讲的就是这样一个数学道理。相比一只丑小鸭跟一只白天鹅之间的区别大,还是两只白天鹅之间的区别大,丑小鸭定理认为丑小鸭与白天鹅之间的区别和两只白天鹅之间的区别一样大。
一般大家会理所当然地认为肯定是丑小鸭和白天鹅之间的区别大,因为二者直观看起来差别实在太大了。然而这只考虑了“外部形象”这个属性,换个角度看就不一定了。如果问“丑小鸭和白天鹅哪个更不怕人”,那答案可能是丑小鸭,也可能是白天鹅。比较两个物品的相似度,要看判定分类的依据和标准是什么。美籍日本学者渡边慧用数理证明丑小鸭与白天鹅之间的差异和两只白天鹅之间的差异一样大。这是一个与常识不符的结论,但他从多个判断标准和角度,对三只禽类(分别用A、B和C代替)进行分类,证明了这个定理,如图1所示。
图1  丑小鸭定理的论证过程
 
具体做法是选择一个属性,符合或具备这个属性的物品划分为一类;不符合或不具备这个属性的,就不能划分为一类。比如选择属性为“排在第一位”,最先被看到的那只就排在第一位,其余两只排在第二和第三位。用“1”代表在这个分类里,“0”代表不在这个分类里。
那么,第一种情况,A这只禽类排在第一位,其值为“1”;而B和C这两只禽类不在第一位,其值均为“0”。所以这个分类结果就用分类值“100”表示。
第二种情况,选择的属性是“羽毛为白色”。如果羽毛是白色,其值是“1”;不是白色,其值是“0”。丑小鸭是黑色的,所以这个分类结果就用分类值“110”表示。
我们可以继续推断下去,给出这三只禽类状态的不同判断指标,比如以下情况:
情况三:“排在第一位且羽毛非白色”,分类值为“000”;
情况四:“羽毛非白色”,分类值为“001”;
情况五:“非在第一位置且羽毛为白色”,分类值为“010”;
情况六:“非在第一位置”,分类值为“011”;
情况七:“排在第一位置或羽毛非白色”,分类值为“101”;
情况八:“非在第一位置或羽毛为白色”,分类值为“111”。
然后针对这三只禽类的八种情况进行分类。从分类值的结果可以看到,两只白天鹅共同为“1”的情况出现了两次,而丑小鸭与白天鹅共同为“1”的情况同样出现了两次。因此,依据数据来判断,丑小鸭与白天鹅之间的差异和两只白天鹅之间的差异一样大。这个看起来完全违背常识的定理实际上说明了这样一个道理:世界上不存在客观的分类标准,一切分类的标准都是主观的。这其实是告诉我们,每个人看这个世界都是带着个人主观判断的,也就是说是带有个人偏见的。比如把物品分成“新”和“旧”两类,这就是“企业资产管理”这个偏见下的一个结果。于是我们可以认为,世界上根本不存在完全客观的物品分类,每一种分类都是主观的;换句话说,每一种分类都是有偏见的,是我们先“偏见”哪个属性最重要,然后才会根据这个属性去分类。从物品分类应用实践情况看,物品分类之所以会存在争议,是因为人们对物品认识角度有所偏差。
我们认识到物品的分类本身就具有非客观性之后,再对物品进行分类的时候,就会尽可能在方法论上迅速地达成一致。既然没有绝对客观的分类,既然分类都带有个人偏好,那么在分类时达成一致就好。进行物品分类的人员需要把物品分类看作是一个主观化的行为过程。当然这也并不是强调物品的分类不能客观。从根本上来说,人的意识也是人脑对客观世界的主观反映。我们看到、听到、闻到、摸到,进而感知了各种物品之后,物品才呈现、反映在人们的意识里;在此之前,这些物品或属性对人的意识来说是不存在的,因为客观世界还没有反映到主观世界。比如在罗马人认识到“铅有毒”这个属性之前,使用铅制容器不但时尚而且是身份的象征;后来由于人们认识到铅有毒,铅制容器自然就被划分为“不能直接存放食物的容器”这个类别了。物质世界的存在首先是客观的,但也需要经过人的认识过程,才最终反映在人的意识中,存在于人的感觉、概念或者观念中。正如伟大的科学家爱丁顿所说,“我们总是认为物质是东西,但现在它不是东西了;现在,物质比起东西而言更像是念头。”
物品的客观世界反映在每个人脑海而形成的意识是不一样的,物品的分类也自然而然是不一样的,是带有个人看法的,从而产生了“偏见”。
物品如何分类
在物品编码这种实践特征明显的领域,个人分类偏见在诸如“开发企业物资物料分类体系”“制定全门类物品分类系统”这样的大目标之下,也许并不重要。
正如庄子在《齐物论》里面说的那样,世界万物看起来千差万别,归根结底却又是齐一的,没有所谓同和不同。庄子说这就是“齐物”。同样,人们的各种看法和观点看起来也是千差万别的,但世间万物既然是齐一的,那么对万物的这些认识归根结底也应是齐一的,没有所谓区别和不同。既然物品之间并没有区别和不同,那就没有本质区别,都是平等的,非要把它们彼此分开,便是人在起作用了,这就是“齐论”。“齐物”和“齐论”合在一起便是“齐物论”。按照庄子的观点,物品同样是没有本质区别的,区别在于人。
物品本身是没有分类的,之所以分类,其因在于人。用康德的话来说就是,“我们关于物先天地认识到的只是我们自己放进它里面的东西。”当我们把自己的“东西”放进“物”里面去时,“物”才成为“物”,“物”是通过人的认识结构而被建立起来的;我们放进去的“东西”不仅是“物”得以被我们先天认识的可能性条件,而且还是“物”得以成为“物”的可能性条件。和庄子一样,在康德看来,根本就不存在所谓“客观”的分类,渡边慧也认为如此,只不过他们的论证方法有差异,渡边慧用的是数学的方法,从数学的角度阐述了这个道理。
示例
在对建筑施工行业的物资物料进行分类时,物资管理员往往会遵照传统习惯,将砂、石、瓦、矿渣、粉煤灰、石膏、瓦片、砖块、陶管等放在一个类目——地材,即地方材料。
如果从物理属性或制造过程来看,这些材料之间的相似性很小,甚至可以说差异很大,比如沙子和粉煤灰。沙子也称为砂,就是细小的石头粒,是组成混凝土和砂浆的主要材料之一,是土木工程建设中常用的大宗材料。砂是在自然条件作用下由岩石风化后经雨水冲刷或岩石倾轧而成的小石粒。粉煤灰又称为飞灰或烟灰,是燃料燃烧所产生烟气中的细微固体颗粒物,如从燃煤电厂烟道气体中收集的细灰。粉煤灰也是一种广泛应用于土木工程的大宗材料,可以用于制作水泥和各种轻质建材。
综上所述,沙子和粉煤灰是两种广泛应用于土木基建工程的大宗材料,无论是制造产生过程,还是成分等属性特征都不相同。最明显的区别是,一个主要是自然条件作用的结果;一个是现代燃煤电力工业生产企业排放的危险废物,是一种工业废渣。但土木建筑领域物资管理人员进行物料分类时却把这两种材料都放在“地方材料”这个类目,是因为这两种材料都是在土木工程施工现场本地就可以出产或生产,而且是土木建筑结构的大宗建筑类材料,其长途运输显然更增加成本,质量差异可以忽略。就这样,这些材料因为“本地可以生产制造,长途贩运成本太高”这一共同特征,被划为一个类目。地方材料的特点是其生产、供应和使用由各地方分(子)公司、项目部甚至施工队决定,由这些部门平衡分配、筹措供应和使用,是相对于集团或公司总部统一集采、统一筹措的物资材料而言的。其特点是品质繁多、规格复杂、生产和使用分散、使用面广、不宜远程运输,比如上面提到的砂、石、瓦、矿渣、粉煤灰、石膏、瓦片、砖块、陶管等。
虽然这些从物理性能、化学特征到制造产生方式都不具有一致性的材料被统一归并在地方材料这个类目下似乎有些奇怪,但有一个现象比较特别,地方材料之下的各个分类又遵循线分类法,如石及石料这个类目下又分山皮石、毛石、片石、块石、粗料石、细料石、碎石、卵石、石板材、砂砾石、煤矸石、石渣、石屑、石粉等近二十个子类。同样,土这个类目下,也按照线分类法划分为粘土、山皮土、膨润土、种植土和其他土五个子类。在石灰(白灰)这个类目下,设置了生石灰、消石灰、电石灰和其他石灰四个子类。
我们把沙子和粉煤灰、陶罐、瓦片、砖块、石膏分为一类,这其实就是土木建筑领域物资管理人员“把这些材料划分为地方材料会降低物资筹措难度,保证施工进度,还可以降低建筑成本,提高企业利润”这个偏见作用之下的一个分类,这是一个主观的分类。到了具体类目之下,如石料、土之下,又具有了逻辑上的归类性,所有的石料归为一类,各种土木建筑工程用到的土归为一类。地方材料的物品划分结果是丑小鸭定理在土木建筑工程领域的一个例证。这其实是在告诉我们,每个人观察世界都带有主观的视角。
总而言之,地方材料的例子告诉我们,物品的分类往往与物资管理人员的意识和价值判断有关,这同样说明每一种分类都是有偏见的。虽然所有物品分类人员都声称在努力寻找那些客观的、本质的物品属性作为企业物资物料分类的依据,尽可能地为物资分类找到一个不带感情色彩的、让人提不出异议的分类体系——事实上他们也在朝着这个方向努力,比如石料和土之下的分类相对严格地遵守了线分类法,但仍然做不到百分百地客观,仍然带有偏见。
因此,物品的分类要做到完全客观、不偏见、不歧视是不可能的。
 
分类标准具有主观性
每个人观察世界都天然地带着个人主观色彩。丑小鸭定理告诉我们,不管我们是不是从“我”的视角出发,一旦涉及分类,那就会存在偏见。我们把东西分成“好”和“坏”,这其实就是说明,对我好不好,对我有没有用。人对物品的分类是功利的,并不客观,根源在于人对物品分类的目的是管理并利用物品。所以物品的分类实际上体现的是人管理物品的要求。分类是具有管理属性的,也可以说分类就是管理。假如现在有一大堆物品,计算机能否根据事物本身的性质自动地、客观地把这些东西分类呢?丑小鸭定理告诉我们,因为我们没有设定分类标准,计算机是不可能完成的。
丑小鸭定理证明了分类有偏见,故而计算机不可自动分类,但它并不是对“齐物论”的证明,而只是一个数理表达。其实结论已经暗含在前提条件中了:当人们认定所有分类标准的权重都一样的时候,得出上述结论就是必然的。显然,丑小鸭定理把权重都看成一样,忽略了权重对于某一事物的重要程度或贡献度,因此,丑小鸭定理本身也是一种偏见。
虽然机器不能根据所谓本质属性对物品进行分类,但机器可以根据人设定的一些条件做出分类的动作,例如根据颜色、大小、重量等进行分类的色选机就是根据不同粮食颗粒光学特性的差异,利用扫描型CCD图像传感等光电探测技术将粮食颗粒中的异色颗粒分辨出来,当被选粮食颗粒从顶部进入机器时,通过振动器装置的振动,被选粮食颗粒沿通道下滑,加速下落进入分选室内的观察区,并从传感器和背景板间穿过。在光源的作用下,根据光的强弱及颜色变化,使系统产生输出信号,从而驱动电磁阀工作,将异色颗粒吹至接料斗的废料腔内,而被选粮食则继续下落至接料斗成品腔内,从而将粮食自动分级分类。色选机被用于散体物料或包装工业品、食品品质检测和分级领域。机器不能根据物品的本质属性进行分类,不能代替人类进行分类,但是机器还是被人设计出来,并按照人的需求和想法帮助人类实现物品的分类。
人所具有的一个基本能力就是对事物进行分类。盘古开天辟地,把一片混沌的世界用斧子劈开,区分了阴阳。清气上升为阳,是为天;浊气下降为阴,是为地。这个神话具有深刻的哲学涵义。归根到底,分类是人的事情。虽然没有客观的分类,不等于说我们从此就不能分类了,也不等于说我们必须把所有物品都“一视同仁”。当把物品分类看作一种方便的认知和管理方式时,我们完全可以随时根据用途和个人的价值观来给物品分类,比如用色选机将碎的、半颗的、外形不完整的大米分出后,得到外形完整、颗粒晶莹的大米,封装在小包装,再装到印刷精美的盒子里,以卖个好价钱。可以说分类的完成是满足了人主观的需要。
韩树文
 作者单位:中国物品编码中心
参考文献
万维刚.你有你的计划,世界另有计划[M].北京:电子工业出版社,2019:104-109.

《中国自动识别技术》2024年第1期总第106期

延伸阅读:

声明:

    凡本网注明“来源:中国自动识别网、《中国自动识别技术》、《条码与信息系统》”的所有作品,版权均属于中国自动识别网、《中国自动识别技术》、《条码与信息系统》, 未经本网授权不得转载、摘编或利用其他方式使用上述作品。已经本网授权使用作品的,应在授权范围内使用,并注明“来源:中国自动识别网、《中国自动识别技术》或《条码与信息系统》”。违反上述声明者,本网将追究其相关法律责任。
    凡本网注明“来源:XXX(非中国自动识别网、《中国自动识别技术》、《条码与信息系统》)”的作品,均转载自其他媒体,转载目的在于传递更多信息,并不代表本网赞同其观点和对其真实性负责。文章内容仅供参考。 如因作品内容、版权和其他问题需要同本网联系的,请将内容传真至010-84295675,以便本网尽快处理。

高端访谈 更多>>
商品二维码 全球商品通用...
王毅 研究员、中国物品编码中心技术部副主任兼二维码研究室主任,国际自动识别与数据采集技术分委会(ISO/IEC JTC 1/...
物品身份及其编码的本质
张成海 中国物品编码中心主任、中国ECR委员会联合主席、国际物品编码组织(GS1)管理委员会委员及顾问委员会委员、全...
推进我国二维码标准化应...
王毅,中国物品编码中心二维码研究室主任,技术部副主任,研究员,国际自动识别与数据采集技术分委会(ISO/IEC JTC1/S...
AVEVA剑维软件: 信息和智...
数据是数字化转型的关键因素,是企业的重要资产。
杂志专区 更多>>

《2024第1期》

《2024第1期》