汉字的构成单位根据传统的汉字结构学说可分为独体字和合体字两类。独体字由笔画构成,如日、月、牛、羊、上、下等。而合体字则由偏旁构成,如休、取、涉、森、竿、架等。偏旁是指六书中会意、形声字中的组成部分,可以表义或表音。例如休字中的亻和木,取字中的耳和又,架字中的加和木等。偏旁由笔画组成,并比笔画高一个层次。偏旁还可以按照成字与否、是否可复合再分等标准进行分类。
然而,传统的六书分析方法已不完全适用于现代汉字。因此,文字学界构建了一个新的汉字结构分析系统,即笔画-部件-整字系统。这个系统引入了部件的概念,部件与偏旁类似,都是汉字的基本结构单位,在笔画和整字之间。但与偏旁不同的是,部件注重现代汉字的字形结构,不仅仅局限于六书中的会意和形声,也不仅仅指具有表音表义的构字成分。例如,简化字“云”中的“二”和“ㄙ”,竖中的“ㄧㄧ”、“又”和“土”并不是偏旁,但它们都是部件。又如,“薅”字由“艹”、“女”、“辰”和“寸”四个部件组成。这种新系统避开了生僻字以及不好解释的偏旁。将汉字分解为部件可以将通用汉字的基本结构单位减少到五六百个,大大减轻了中文信息处理的困难。