Skip to content

与 C 互操作

DANGER

C 库的导入是实验性的

所有由 cinterop 工具从 C 库生成的 Kotlin 声明

都应带有 @ExperimentalForeignApi 注解。

Kotlin/Native 自带的原生平台库(如 Foundation、UIKit 和 POSIX)

仅对某些 API 要求显式选择启用。

本文档涵盖了 Kotlin 与 C 互操作性的通用方面。Kotlin/Native 提供了一个 cinterop 工具,你可以使用它快速生成与外部 C 库交互所需的一切。

该工具分析 C 头文件,并将 C 类型、函数和常量直观地映射到 Kotlin。生成的存根随后可以导入到 IDE 中,以启用代码补全和导航功能。

TIP

Kotlin 还提供了与 Objective-C 的互操作性。Objective-C 库也通过 cinterop 工具导入。有关更多详细信息,请参阅 Swift/Objective-C 互操作

设置项目

以下是需要调用 C 库的项目的一般工作流程:

  1. 创建并配置一个定义文件。它描述了 cinterop 工具应包含到 Kotlin 绑定中的内容。
  2. 配置你的 Gradle 构建文件,以便在构建过程中包含 cinterop。
  3. 编译并运行项目,生成最终的可执行文件。

NOTE

如需亲身体验,请完成 创建使用 C 互操作的应用程序 教程。

在许多情况下,无需配置与 C 库的自定义互操作性。相反,你可以使用平台标准化绑定中可用的 API,这些绑定被称为平台库。例如,Linux/macOS 平台上的 POSIX、Windows 平台上的 Win32 或 macOS/iOS 上的 Apple 框架均以这种方式提供。

绑定

基本互操作类型

所有支持的 C 类型在 Kotlin 中都有相应的表示:

  • 有符号、无符号整型和浮点型映射到具有相同宽度的 Kotlin 对应类型。
  • 指针和数组映射到 CPointer<T>?
  • 枚举可以映射到 Kotlin 枚举或整型值,具体取决于启发式方法和定义文件设置
  • 结构体和联合体映射到可通过点表示法访问字段的类型,例如 someStructInstance.field1
  • typedef 表示为 typealias

此外,任何 C 类型都对应一个 Kotlin 类型,该类型表示此类型的左值,即位于内存中的值,而非简单的不可变的独立值。可以将其视为 C++ 引用类似的概念。对于结构体(以及 typedef 到结构体),这种表示是主要的,并且与结构体本身同名。对于 Kotlin 枚举,它被命名为 ${type}.Var;对于 CPointer<T>,它被命名为 CPointerVar<T>;对于大多数其他类型,它被命名为 ${type}Var

对于同时具有两种表示的类型,带有左值表示的类型拥有一个可变的 .value 属性,用于访问值。

指针类型

CPointer<T> 的类型参数 T 必须是上述左值类型之一。例如,C 类型 struct S* 映射到 CPointer<S>int8_t* 映射到 CPointer<int_8tVar>,而 char** 映射到 CPointer<CPointerVar<ByteVar>>

C 空指针表示为 Kotlin 的 null,并且指针类型 CPointer<T> 不可空,但 CPointer<T>? 是可空的。此类型的值支持所有与处理 null 相关的 Kotlin 操作,例如 ?:?.!! 等:

kotlin
val path = getenv("PATH")?.toKString() ?: ""

由于数组也映射到 CPointer<T>,因此它支持 [] 运算符,用于按索引访问值:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
fun shift(ptr: CPointer<ByteVar>, length: Int) {
    for (index in 0 .. length - 2) {
        ptr[index] = ptr[index + 1]
    }
}

CPointer<T>.pointed 属性返回由此指针指向的类型 T 的左值。反向操作是 .ptr,它接受左值并返回指向它的指针。

void* 映射到 COpaquePointer——这种特殊的指针类型是任何其他指针类型的超类型。因此,如果 C 函数接受 void*,Kotlin 绑定将接受任何 CPointer

指针(包括 COpaquePointer)的类型转换可以使用 .reinterpret<T> 完成,例如:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
val intPtr = bytePtr.reinterpret<IntVar>()

或:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
val intPtr: CPointer<IntVar> = bytePtr.reinterpret()

与 C 一样,这些 .reinterpret 类型转换是不安全的,并可能在应用程序中导致潜在的细微内存问题。

此外,CPointer<T>?Long 之间存在不安全类型转换,由 .toLong().toCPointer<T>() 扩展方法提供:

kotlin
val longValue = ptr.toLong()
val originalPtr = longValue.toCPointer<T>()

TIP

如果结果的类型可以从上下文中推断出来,则可以省略类型参数。

内存分配

原生内存可以使用 NativePlacement 接口进行分配,例如:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
val byteVar = placement.alloc<ByteVar>()

或:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
val bytePtr = placement.allocArray<ByteVar>(5)

最合理的分配位置是在 nativeHeap 对象中。它对应于使用 malloc 分配原生内存,并提供额外的 .free() 操作来释放已分配的内存:

kotlin
import kotlinx.cinterop.*

@OptIn(kotlinx.cinterop.ExperimentalForeignApi::class)
fun main() {
    val size: Long = 0
    val buffer = nativeHeap.allocArray<ByteVar>(size)
    nativeHeap.free(buffer)
}

nativeHeap 需要手动释放内存。然而,将内存分配的生命周期绑定到词法作用域通常很有用。如果此类内存能自动释放,将非常有帮助。

为此,你可以使用 memScoped { }。在花括号内部,临时分配作为隐式接收者可用,因此可以使用 allocallocArray 分配原生内存,并且分配的内存将在离开作用域后自动释放。

例如,一个通过指针参数返回值的 C 函数可以这样使用:

kotlin
import kotlinx.cinterop.*
import platform.posix.*

@OptIn(ExperimentalForeignApi::class)
val fileSize = memScoped {
    val statBuf = alloc<stat>()
    val error = stat("/", statBuf.ptr)
    statBuf.st_size
}

将指针传递给绑定

尽管 C 指针映射到 CPointer<T> 类型,但 C 函数指针类型的参数映射到 CValuesRef<T>。当将 CPointer<T> 作为此类参数的值传递时,它将按原样传递给 C 函数。然而,也可以传递一个值序列而非指针。在这种情况下,该序列是"按值"传递的,即 C 函数接收到该序列的临时副本的指针,该副本仅在函数返回前有效。

指针参数的 CValuesRef<T> 表示旨在支持 C 数组字面量,而无需显式原生内存分配。为了构造不可变的独立 C 值序列,提供了以下方法:

  • ${type}Array.toCValues(),其中 type 是 Kotlin 基本类型
  • Array<CPointer<T>?>.toCValues(), List<CPointer<T>?>.toCValues()
  • cValuesOf(vararg elements: ${type}),其中 type 是基本类型或指针

例如:

c
// C:
void foo(int* elements, int count);
...
int elements[] = {1, 2, 3};
foo(elements, 3);
kotlin
// Kotlin:

foo(cValuesOf(1, 2, 3), 3)

字符串

与其他指针不同,类型为 const char* 的参数表示为 Kotlin String。因此,可以将任何 Kotlin 字符串传递给期望 C 字符串的绑定。

也有一些工具可用于手动在 Kotlin 字符串和 C 字符串之间进行转换:

  • fun CPointer<ByteVar>.toKString(): String
  • val String.cstr: CValuesRef<ByteVar>.

要获取指针,.cstr 应该在原生内存中分配,例如:

kotlin
val cString = kotlinString.cstr.getPointer(nativeHeap)

在所有情况下,C 字符串都应编码为 UTF-8。

要跳过自动转换并确保在绑定中使用原始指针,请将 noStringConversion 属性添加到 .def 文件中:

c
noStringConversion = LoadCursorA LoadCursorW

这样,任何 CPointer<ByteVar> 类型的值都可以作为 const char* 类型的参数传递。如果需要传递 Kotlin 字符串,可以使用如下代码:

kotlin
import kotlinx.cinterop.*

@OptIn(kotlinx.cinterop.ExperimentalForeignApi::class)
memScoped {
    LoadCursorA(null, "cursor.bmp".cstr.ptr)  // for ASCII or UTF-8 version
    LoadCursorW(null, "cursor.bmp".wcstr.ptr) // for UTF-16 version
}

作用域局部指针

可以使用 memScoped {} 中可用的 CValues<T>.ptr 扩展属性,为 CValues<T> 实例创建 C 表示的、作用域稳定的指针。它允许使用需要 C 指针且生命周期绑定到特定 MemScope 的 API。例如:

kotlin
import kotlinx.cinterop.*

@OptIn(kotlinx.cinterop.ExperimentalForeignApi::class)
memScoped {
    items = arrayOfNulls<CPointer<ITEM>?>(6)
    arrayOf("one", "two").forEachIndexed { index, value -> items[index] = value.cstr.ptr }
    menu = new_menu("Menu".cstr.ptr, items.toCValues().ptr)
    // ...
}

在此示例中,传递给 C API new_menu() 的所有值的生命周期都属于它们所属的最内层 memScope。一旦控制流离开 memScoped 作用域,C 指针将变为无效。

按值传递和接收结构体

当 C 函数按值接受或返回结构体/联合体 T 时,相应的参数类型或返回类型表示为 CValue<T>

CValue<T> 是一个不透明类型,因此结构体字段不能通过相应的 Kotlin 属性访问。如果 API 使用结构体作为不透明句柄,这可能没问题。但是,如果需要访问字段,则可以使用以下转换方法:

  • fun T.readValue(): CValue<T> 将(左值)T 转换为 CValue<T>。因此,要构造 CValue<T>,可以先分配 T、填充它,然后将其转换为 CValue<T>
  • CValue<T>.useContents(block: T.() -> R): R 暂时将 CValue<T> 存储在内存中,然后以该放置的值 T 作为接收者运行传入的 lambda。因此,要读取单个字段,可以使用以下代码:
kotlin
val fieldValue = structValue.useContents { field }

回调

要将 Kotlin 函数转换为 C 函数指针,可以使用 staticCFunction(::kotlinFunction)。也可以提供 lambda 而不是函数引用。函数或 lambda 不得捕获任何值。

将用户数据传递给回调

C API 通常允许将一些用户数据传递给回调。此类数据通常由用户在配置回调时提供。例如,它作为 void* 传递给某个 C 函数(或写入结构体)。然而,Kotlin 对象的引用不能直接传递给 C。因此,它们需要在配置回调之前进行封装,然后在回调本身中解封装,以安全地通过 C 世界从 Kotlin 传输到 Kotlin。可以使用 StableRef 类进行此类封装。

封装引用:

kotlin
import kotlinx.cinterop.*

@OptIn(ExperimentalForeignApi::class)
val stableRef = StableRef.create(kotlinReference)
val voidPtr = stableRef.asCPointer()

在这里,voidPtr 是一个 COpaquePointer,可以传递给 C 函数。

解封装引用:

kotlin
@OptIn(ExperimentalForeignApi::class)
val stableRef = voidPtr.asStableRef<KotlinClass>()
val kotlinReference = stableRef.get()

在这里,kotlinReference 是原始的封装引用。

创建的 StableRef 最终必须使用 .dispose() 方法手动释放,以防止内存泄漏:

kotlin
stableRef.dispose()

此后它将变为无效,因此 voidPtr 不能再解封装。

每个展开为常量的 C 宏都表示为一个 Kotlin 属性。

在编译器可以推断类型的情况下,支持无参数宏:

c
int foo(int);
#define FOO foo(42)

在这种情况下,FOO 在 Kotlin 中可用。

为了支持其他宏,你可以通过用支持的声明封装它们来手动暴露它们。例如,函数式宏 FOO 可以通过向库添加自定义声明来暴露为函数 foo()

c
headers = library/base.h

---

static inline int foo(int arg) {
    return FOO(arg);
}

可移植性

有时 C 库的函数参数或结构体字段是平台相关的类型,例如 longsize_t。Kotlin 本身不提供隐式整型转换或 C 风格的整型转换(例如 (size_t) intValue),因此为了便于在这种情况下编写可移植代码,提供了 convert 方法:

kotlin
fun ${type1}.convert<${type2}>(): ${type2}

在这里,type1type2 都必须是整型,可以是带符号或无符号的。

.convert<${type}> 具有与 .toByte.toShort.toInt.toLong.toUByte.toUShort.toUInt.toULong 方法之一相同的语义,具体取决于 type

使用 convert 的示例:

kotlin
import kotlinx.cinterop.*
import platform.posix.*

@OptIn(ExperimentalForeignApi::class)
fun zeroMemory(buffer: COpaquePointer, size: Int) {
    memset(buffer, 0, size.convert<size_t>())
}

此外,类型参数可以自动推断,因此在某些情况下可以省略。

对象固定 (Object pinning)

Kotlin 对象可以被固定(pin),即它们在内存中的位置被保证是稳定的,直到它们被解除固定(unpin),并且指向这些对象内部数据的指针可以传递给 C 函数。

有几种方法可以采用:

  • 使用 usePinned 服务函数,该函数会固定一个对象,执行一个代码块,并在正常和异常路径上解除固定:
kotlin
import kotlinx.cinterop.*
import platform.posix.*

@OptIn(ExperimentalForeignApi::class)
fun readData(fd: Int) {
    val buffer = ByteArray(1024)
    buffer.usePinned { pinned ->
        while (true) {
            val length = recv(fd, pinned.addressOf(0), buffer.size.convert(), 0).toInt()
            if (length <= 0) {
                break
            }
            // Now `buffer` has raw data obtained from the `recv()` call.
        }
    }
}

在这里,pinned 是一个特殊类型 Pinned<T> 的对象。它提供了有用的扩展,例如 addressOf,允许获取固定数组体的地址。

  • 使用 refTo() 函数,它在底层具有类似的功能,但在某些情况下可能有助于减少样板代码:
kotlin
import kotlinx.cinterop.*
import platform.posix.*
  
@OptIn(ExperimentalForeignApi::class)
fun readData(fd: Int) { 
    val buffer = ByteArray(1024)
    while (true) {
        val length = recv(fd, buffer.refTo(0), buffer.size.convert(), 0).toInt()

        if (length <= 0) {
            break
        }
        // Now `buffer` has raw data obtained from the `recv()` call.
    }
}

在这里,buffer.refTo(0) 具有 CValuesRef 类型,它在进入 recv() 函数之前固定数组,将其第零个元素的地址传递给函数,并在退出后解除固定数组。

前向声明

要导入前向声明,请使用 cnames 包。例如,要导入在 C 库中声明的 cstructName 前向声明,其 library.package 可以使用一个特殊的前向声明包:import cnames.structs.cstructName

考虑两个 cinterop 库:一个包含结构体的前向声明,另一个在不同的包中包含实际实现:

c
// First C library
#include <stdio.h>

struct ForwardDeclaredStruct;

void consumeStruct(struct ForwardDeclaredStruct* s) {
    printf("Struct consumed
");
}
c
// Second C library
// Header:
#include <stdlib.h>

struct ForwardDeclaredStruct {
    int data;
};

// Implementation:
struct ForwardDeclaredStruct* produceStruct() {
    struct ForwardDeclaredStruct* s = malloc(sizeof(struct ForwardDeclaredStruct));
    s->data = 42;
    return s;
}

要在两个库之间传输对象,请在 Kotlin 代码中使用显式 as 转换:

kotlin
// Kotlin code:
fun test() {
    consumeStruct(produceStruct() as CPointer<cnames.structs.ForwardDeclaredStruct>)
}

接下来

通过完成以下教程,了解类型、函数和常量如何在 Kotlin 和 C 之间映射: