关于 kobject、kset 和 ktype 的所有你不想知道的事情¶
- 作者:
Greg Kroah-Hartman <gregkh@linuxfoundation.org>
- 最后更新:
2007 年 12 月 19 日
基于 Jon Corbet 于 2003 年 10 月 1 日为 lwn.net 撰写的原始文章,位于 https://lwn.net/Articles/51437/
理解驱动模型(以及其所基于的 kobject 抽象)的困难之一在于,没有一个明显的切入点。处理 kobject 需要理解几种不同的类型,它们都相互引用。为了简化问题,我们将采用多遍方法,从模糊的术语开始,然后逐步添加细节。为此,这里对我们将要用到的一些术语进行快速定义。
kobject 是
struct kobject
类型的一个对象。Kobject 具有名称和引用计数。Kobject 还具有一个父指针(允许对象排列成层次结构)、一个特定类型,并且通常在sysfs
虚拟文件系统中有一个表示。Kobject 通常本身并不有趣;相反,它们通常嵌入在其他结构中,这些结构包含代码真正感兴趣的内容。
任何结构都绝不能嵌入一个以上的 kobject。如果嵌入了多个,对象的引用计数肯定会出错和不正确,您的代码将存在缺陷。所以不要这样做。
ktype 是嵌入 kobject 的对象类型。每个嵌入 kobject 的结构都需要一个相应的 ktype。ktype 控制 kobject 在创建和销毁时会发生什么。
kset 是一组 kobject。这些 kobject 可以是相同的 ktype,也可以属于不同的 ktype。kset 是 kobject 集合的基本容器类型。Kset 包含它们自己的 kobject,但您可以安全地忽略该实现细节,因为 kset 核心代码会自动处理此 kobject。
当您看到一个充满其他目录的
sysfs
目录时,通常每个目录都对应于同一 kset 中的一个 kobject。
我们将了解如何创建和操作所有这些类型。我们将采用自下而上的方法,所以我们将回到 kobject。
嵌入 kobject¶
内核代码很少创建独立的 kobject,下面将解释一个主要例外。相反,kobject 用于控制对更大的、特定领域对象的访问。为此,kobject 将嵌入在其他结构中。如果您习惯于用面向对象的术语思考问题,kobject 可以被视为一个顶层抽象类,其他类由此派生。kobject 实现了一组本身并不特别有用,但在其他对象中却很好的功能。C 语言不允许直接表达继承,因此必须使用其他技术,例如结构体嵌入。
(顺便说一句,对于熟悉内核链表实现的人来说,这类似于“list_head”结构本身很少有用,但总是嵌入在更大型的对象中。)
因此,例如,drivers/uio/uio.c
中的 UIO 代码有一个结构体,用于定义与 uio 设备关联的内存区域。
struct uio_map {
struct kobject kobj;
struct uio_mem *mem;
};
如果您有一个 struct uio_map
结构体,查找其嵌入的 kobject 只需要使用 kobj
成员即可。然而,处理 kobject 的代码通常会遇到相反的问题:给定一个 struct kobject
指针,如何获取指向包含结构的指针?您必须避免技巧(例如假设 kobject 位于结构体的开头),而应使用在 <linux/kernel.h>
中找到的 container_of()
宏。
container_of(ptr, type, member)
其中
ptr
是嵌入 kobject 的指针,
type
是包含结构体的类型,并且
member
是pointer
指向的结构体字段的名称。
container_of()
的返回值是指向相应容器类型的指针。因此,例如,一个指向嵌入在 struct uio_map
内的 struct kobject
的指针 kp
可以通过以下方式转换为指向包含 uio_map
结构体的指针:
struct uio_map *u_map = container_of(kp, struct uio_map, kobj);
为了方便起见,程序员通常会定义一个简单的宏,用于将 kobject 指针反向转换为包含类型。在之前的 drivers/uio/uio.c
中正是如此,您可以在此处看到:
struct uio_map {
struct kobject kobj;
struct uio_mem *mem;
};
#define to_map(map) container_of(map, struct uio_map, kobj)
其中宏参数 “map” 是指向相关 struct kobject
的指针。该宏随后通过以下方式调用:
struct uio_map *map = to_map(kobj);
kobject 的初始化¶
创建 kobject 的代码当然必须初始化该对象。某些内部字段是通过(强制性的)调用 kobject_init()
来设置的。
void kobject_init(struct kobject *kobj, const struct kobj_type *ktype);
ktype 是正确创建 kobject 所必需的,因为每个 kobject 都必须有一个关联的 kobj_type
。在调用 kobject_init()
之后,要向 sysfs
注册该 kobject,必须调用函数 kobject_add()
。
int kobject_add(struct kobject *kobj, struct kobject *parent,
const char *fmt, ...);
这会正确设置 kobject 的父级和 kobject 的名称。如果 kobject 要与特定的 kset 关联,则必须在调用 kobject_add()
之前分配 kobj->kset
。如果 kobject 与 kset 关联,则可以在调用 kobject_add()
时将 kobject 的父级设置为 NULL,然后 kobject 的父级将是 kset 本身。
由于 kobject 的名称是在将其添加到内核时设置的,因此 kobject 的名称绝不应直接操作。如果必须更改 kobject 的名称,请调用 kobject_rename()
。
int kobject_rename(struct kobject *kobj, const char *new_name);
kobject_rename()
不执行任何锁定操作,也没有关于哪些名称有效的明确概念,因此调用者必须提供自己的健全性检查和序列化。
有一个名为 kobject_set_name()
的函数,但那是遗留的冗余代码,正在被移除。如果您的代码需要调用此函数,则它是错误的,需要修复。
要正确访问 kobject 的名称,请使用函数 kobject_name()
。
const char *kobject_name(const struct kobject * kobj);
有一个辅助函数可以同时初始化 kobject 并将其添加到内核,令人惊讶的是它被称为 kobject_init_and_add()
。
int kobject_init_and_add(struct kobject *kobj, const struct kobj_type *ktype,
struct kobject *parent, const char *fmt, ...);
参数与上面描述的单独的 kobject_init()
和 kobject_add()
函数相同。
Uevent 事件¶
kobject 注册到 kobject 核心后,您需要向外界宣布它已被创建。这可以通过调用 kobject_uevent()
来完成。
int kobject_uevent(struct kobject *kobj, enum kobject_action action);
当 kobject 首次添加到内核时,使用 KOBJ_ADD 操作。这应该仅在 kobject 的任何属性或子级已正确初始化之后进行,因为此调用发生时,用户空间会立即开始查找它们。
当 kobject 从内核中移除时(详细信息如下),KOBJ_REMOVE 的 uevent 将由 kobject 核心自动创建,因此调用者无需担心手动执行此操作。
引用计数¶
kobject 的关键功能之一是作为其嵌入对象的引用计数器。只要存在对对象的引用,对象(以及支持它的代码)就必须继续存在。用于操作 kobject 引用计数的底层函数是:
struct kobject *kobject_get(struct kobject *kobj);
void kobject_put(struct kobject *kobj);
成功调用 kobject_get()
会递增 kobject 的引用计数器并返回指向该 kobject 的指针。
当一个引用被释放时,调用 kobject_put()
将递减引用计数,并可能释放对象。请注意,kobject_init()
将引用计数设置为一,因此设置 kobject 的代码最终需要执行一次 kobject_put()
以释放该引用。
由于 kobject 是动态的,它们不能被声明为静态的或在栈上,而应始终动态分配。内核的未来版本将包含对静态创建的 kobject 的运行时检查,并将警告开发者这种不当用法。
如果您只想使用 kobject 为您的结构提供引用计数器,请改用 struct kref
;使用 kobject 将会是多余的。有关如何使用 struct kref
的更多信息,请参阅 Linux 内核源代码树中的文件 为内核对象添加引用计数器 (krefs)。
创建“简单” kobject¶
有时,开发人员只是想在 sysfs
层次结构中创建一个简单的目录,而无需处理 kset、show
和 store
函数以及其他细节的复杂性。这是应该创建单个 kobject 的一个例外情况。要创建这样一个条目,请使用函数:
struct kobject *kobject_create_and_add(const char *name, struct kobject *parent);
此函数将创建一个 kobject,并将其放置在 sysfs
中指定父 kobject 下的位置。要创建与此 kobject 关联的简单属性,请使用:
int sysfs_create_file(struct kobject *kobj, const struct attribute *attr);
或
int sysfs_create_group(struct kobject *kobj, const struct attribute_group *grp);
这里使用的两种属性类型,对于通过 kobject_create_and_add()
创建的 kobject,都可以是 kobj_attribute
类型,因此无需创建特殊的自定义属性。
有关简单 kobject 和属性的实现,请参阅示例模块 samples/kobject/kobject-example.c
。
ktype 和 release 方法¶
讨论中仍缺少一个重要事项,即当 kobject 的引用计数达到零时会发生什么。创建 kobject 的代码通常不知道何时会发生这种情况;如果知道,那么一开始使用 kobject 就没有什么意义了。当 sysfs
介入时,即使是可预测的对象生命周期也会变得更加复杂,因为内核的其他部分可以获取系统中注册的任何 kobject 的引用。
最终结果是,受 kobject 保护的结构在其引用计数归零之前不能被释放。引用计数不受创建 kobject 的代码的直接控制。因此,当其 kobject 的最后一个引用消失时,必须异步通知该代码。
一旦您通过 kobject_add()
注册了您的 kobject,就绝不能直接使用 kfree()
来释放它。唯一安全的方法是使用 kobject_put()
。在调用 kobject_init()
之后始终使用 kobject_put()
是一个好习惯,以避免错误悄然出现。
此通知是通过 kobject 的 release()
方法完成的。通常此类方法的形式如下:
void my_object_release(struct kobject *kobj)
{
struct my_object *mine = container_of(kobj, struct my_object, kobj);
/* Perform any additional cleanup on this object, then... */
kfree(mine);
}
一个重要的点怎么强调都不为过:每个 kobject 都必须有一个 release()
方法,并且 kobject 必须持续存在(处于一致状态)直到该方法被调用。如果这些约束未满足,则代码存在缺陷。请注意,如果您忘记提供 release()
方法,内核会警告您。不要试图通过提供一个“空”的释放函数来消除此警告。
如果您所有的清理函数只需要调用 kfree()
,那么您必须创建一个包装函数,该函数使用 container_of()
向上转换为正确的类型(如上例所示),然后对整个结构体调用 kfree()
。
请注意,kobject 的名称在 release
函数中可用,但在此回调中绝不能更改它。否则,kobject 核心将出现内存泄漏,这将令人不悦。
有趣的是,release()
方法并非存储在 kobject 本身中;相反,它与 ktype 相关联。因此,让我们介绍一下 struct kobj_type
:
struct kobj_type {
void (*release)(struct kobject *kobj);
const struct sysfs_ops *sysfs_ops;
const struct attribute_group **default_groups;
const struct kobj_ns_type_operations *(*child_ns_type)(struct kobject *kobj);
const void *(*namespace)(struct kobject *kobj);
void (*get_ownership)(struct kobject *kobj, kuid_t *uid, kgid_t *gid);
};
此结构用于描述特定类型的 kobject(或更准确地说,是包含对象)。每个 kobject 都需要有一个关联的 kobj_type
结构;当您调用 kobject_init()
或 kobject_init_and_add()
时,必须指定指向该结构体的指针。
struct kobj_type
中的 release
字段当然是指向此类 kobject 的 release()
方法的指针。另外两个字段(sysfs_ops
和 default_groups
)控制此类对象在 sysfs
中的表示方式;它们超出了本文档的范围。
default_groups
指针是一个默认属性列表,这些属性将为任何注册到此 ktype 的 kobject 自动创建。
kset¶
kset 仅仅是希望相互关联的 kobject 的集合。没有规定它们必须是相同的 ktype,但如果不是,请务必小心。
kset 具有以下功能:
它作为一个包含一组对象的“袋子”。内核可以使用 kset 来跟踪“所有块设备”或“所有 PCI 设备驱动程序”。
kset 也是
sysfs
中的一个子目录,与 kset 关联的 kobject 可以在其中显示。每个 kset 都包含一个 kobject,该 kobject 可以设置为其他 kobject 的父级;sysfs
层次结构的顶级目录就是以这种方式构建的。Kset 可以支持 kobject 的“热插拔”,并影响 uevent 事件如何报告给用户空间。
用面向对象的术语来说,“kset”是顶层容器类;kset 包含它们自己的 kobject,但该 kobject 由 kset 代码管理,不应由任何其他用户操作。
kset 将其子项保存在标准的内核链表中。Kobject 通过其 kset
字段指向其包含的 kset。在几乎所有情况下,属于 kset 的 kobject 都将其 kset(或严格来说,其嵌入的 kobject)作为其父级。
由于 kset 内部包含一个 kobject,因此它应该始终动态创建,而绝不能静态声明或在栈上声明。要创建一个新的 kset,请使用:
struct kset *kset_create_and_add(const char *name,
const struct kset_uevent_ops *uevent_ops,
struct kobject *parent_kobj);
当您使用完 kset 后,请调用:
void kset_unregister(struct kset *k);
来销毁它。这会将 kset 从 sysfs
中移除并递减其引用计数。当引用计数变为零时,kset 将被释放。由于可能仍然存在对 kset 的其他引用,因此释放可能在 kset_unregister()
返回之后发生。
在内核树中的 samples/kobject/kset-example.c
文件中可以看到使用 kset 的示例。
如果 kset 希望控制与其关联的 kobject 的 uevent 操作,它可以使用 struct kset_uevent_ops
来处理:
struct kset_uevent_ops {
int (* const filter)(struct kobject *kobj);
const char *(* const name)(struct kobject *kobj);
int (* const uevent)(struct kobject *kobj, struct kobj_uevent_env *env);
};
filter 函数允许 kset 阻止为特定 kobject 向用户空间发出 uevent。如果函数返回 0,则不会发出 uevent。
name 函数将被调用以覆盖 uevent 发送到用户空间的 kset 的默认名称。默认情况下,名称将与 kset 本身相同,但如果此函数存在,则可以覆盖该名称。
uevent 函数将在 uevent 即将发送到用户空间时被调用,以允许向 uevent 添加更多环境变量。
有人可能会问,既然没有介绍执行该功能的函数,kobject 是如何精确地添加到 kset 的。答案是此任务由 kobject_add()
处理。当 kobject 传递给 kobject_add()
时,其 kset
成员应指向 kobject 将所属的 kset。kobject_add()
将处理其余部分。
如果属于 kset 的 kobject 没有设置父 kobject,它将被添加到 kset 的目录中。并非 kset 的所有成员都必须存在于 kset 目录中。如果在添加 kobject 之前分配了一个显式的父 kobject,则 kobject 将注册到 kset,但添加在父 kobject 下。
kobject 移除¶
kobject 成功注册到 kobject 核心后,代码使用完毕时必须对其进行清理。为此,请调用 kobject_put()
。通过这样做,kobject 核心将自动清理此 kobject 分配的所有内存。如果已为该对象发送了 KOBJ_ADD
uevent,则将发送相应的 KOBJ_REMOVE
uevent,并且将为调用者正确处理任何其他 sysfs
清理工作。
如果您需要对 kobject 进行两阶段删除(例如,当您需要销毁对象时不允许休眠),那么请调用 kobject_del()
,它将从 sysfs
中注销 kobject。这使得 kobject “不可见”,但它并未被清理,并且对象的引用计数仍然相同。稍后调用 kobject_put()
以完成与 kobject 关联的内存清理。
如果构建了循环引用,可以使用 kobject_del()
来解除对父对象的引用。在某些情况下,父对象引用子对象是有效的。循环引用必须通过显式调用 kobject_del()
来解除,以便调用释放函数,并且先前循环中的对象相互释放。
可供复制的示例代码¶
要查看正确使用 kset 和 kobject 的更完整示例,请参阅示例程序 samples/kobject/{kobject-example.c,kset-example.c}
,如果您选择了 CONFIG_SAMPLE_KOBJECT
,它们将作为可加载模块构建。