当前位置: 首页 > news >正文

如何解决 Kotlin/Native 在 Windows 下 main 函数的 args 乱码?

之前在用 Kotlin/Native 写 codex-kkp 的时候遇到了一个问题:
当我尝试在 Windows 的命令行上向它的产物 exe 传递参数的时候,传入的中文参数会变成我们熟悉又陌生的乱码“锟斤拷”。

codex-kkp-cli.exe"分析代码"# 实际收到的参数变成了乱码

问题分析

那么为什么会这样呢?众所周知,“锟斤拷”系列的乱码通常是 GBK 和 UTF-8 之间的错误转码导致的。
而又众所周知,Windows 存在两套字符API:GBK 是 Windows 默认的中文系统编码(A 版本, ANSI),
UTF-16 则是内核的原生编码(W 版本, 宽、Unicode)。

参考文档:

  • Windows API 中的 Unicode
  • 代码页

而 Kotlin/Native mingwX64 平台 的 main 函数编译后会使用 ANSI 版本的API的入口点:

launcher.cpp#L72-L78
中的Konan_main函数:

extern "C" RUNTIME_EXPORT int Konan_main(int argc, const char** argv) { return Init_and_run_start(argc, argv, 1); }

和 StubIrDriver.kt#L225-L232
里面生成的 main 函数:

out("extern int Konan_main(int argc, char** argv);") out("") out("__attribute__((__used__))") out("int $entryPoint(int argc, char** argv) {") out(" return Konan_main(argc, argv);") out("}")

也就是:

extern int Konan_main(int argc, char** argv); int main(int argc, char** argv) { return Konan_main(argc, argv); }

它没有使用wmainwchar_t** argv,所以它使用的是 ANSI 的 API 而不是 Unicode 的那个。

这个问题在 YouTrack 上也有相关记载:

  • KT-82801: Kotlin/Native: Windows Non-ASCII command-line arguments garbled characters
  • KT-80201: K/N: Windows main(args) receives corrupted Unicode arguments

在 KT-80201 中,也有热心网友贴出了解决方案,这也是接下来要进行介绍的内容。

解决方案

如果你比较熟悉 Windows 的 API,那么应该很快就能想到该如何了解。但是我就不一样了,我对这类 native 相关的东西一窍不通(

OK 言归正传,由于 Kotlin 的main函数接收到的args已经是处于乱码状态的错误参数,因此我们不能直接使用这个args了,
而是要用 Windows 的 W 版本 API 来直接获取通过 UTF-16 编码的正确参数,以此绕过 ANSI 的入口点带来的错误结果。

那么怎么绕开呢?说难也不难,我们可以直接通过platform.windows.GetCommandLineW()来获取 UTF-16 的命令行参数。
完整代码参考如下:

fun getUnicodeArgs(): Array<String> = memScoped { // 获取原始的 UTF-16 命令行 val commandLine = GetCommandLineW() ?: return@memScoped emptyArray() // 解析命令行为参数数组 val argc = alloc<IntVar>() val argv = CommandLineToArgvW(commandLine.toKString(), argc.ptr) ?: return@memScoped emptyArray() try { val argCount = argc.value if (argCount <= 1) { // 只有程序名本身,没有其他参数 return@memScoped emptyArray() } // 转换参数(跳过程序名) Array(argCount - 1) { index -> argv[index + 1]?.toKStringFromUtf16() ?: "" } } finally { LocalFree(argv) } }

通过GetCommandLineW获取到W版本的命令行参数,然后通过CommandLineToArgvW将它们解析为参数数组,
随后将程序名之后的真正的 args 们通过toKStringFromUtf16转化为 Kotlin String 之后就得到了之最终我们需要的东西:
不乱码的 args 数组。

在一个 KMP 项目中,我们现在可以通过expect/actual来实现 mingwX64 平台下对参数的解析(至少我现在是这么做的):

// commonMain - 声明期望函数 internal expect fun resolveArgs(args: Array<String>): Array<String> // appleMain & linuxMain - 直接返回原参数(这些平台默认 UTF-8) internal actual fun resolveArgs(args: Array<String>): Array<String> = args // mingwMain - 使用 Windows Unicode API 重新获取参数 internal actual fun resolveArgs(args: Array<String>): Array<String> { // ... Unicode 处理逻辑 }

main方法中:

fun main(args: Array<String>) { val processedArgs = resolveArgs(args) // 接下来使用 processedArgs 而不是 args(你直接用 args 覆盖也行) }

总结

根据 KT-80201 的状态,至少目前来看官方还没有解决这个问题。
如果你比较关心这个问题的话,可以追踪下这个 issue,跟踪它的未来进展。

http://www.rkmt.cn/news/116536.html

相关文章:

  • EmotiVoice是否支持增量更新?模型热升级可行性探讨
  • 32、Linux系统基础操作与管理知识解析
  • Pyxel编辑器入门指南:零基础掌握像素艺术与游戏创作
  • 如何用4步实现实时AI视频生成:Wan2.1模型完整指南
  • 3分钟搭建专业博客:为什么Tailwind Next.js模板完胜传统方案?
  • dart特性之 --- mixin
  • 大专会计就业规划:上岗必考7大证书盘点与企业刚需解析
  • EmotiVoice情感分类体系揭秘:六种基础情绪如何建模?
  • ScriptHookV模组开发实战:从入门到精通的完整指南
  • 单词倒排 和 字符串P型编码
  • 结合LLM使用EmotiVoice:大模型+情感语音的完整闭环方案
  • Windows程序资源编辑神器rcedit:告别繁琐的图形界面操作
  • Doris集群搭建
  • React Native Vision Camera实战:从零构建高性能AR拍摄应用
  • EmotiVoice技术解析:多情感语音合成背后的秘密
  • 重磅!AI应用架构师力推的企业虚拟运营方案_副本
  • EmotiVoice能否用于外语学习?模仿母语者语调的功能验证
  • Easy Effects音效优化完全指南:从入门到精通的专业预设配置
  • ComfyUI-SeedVR2视频超分插件完整安装与配置指南
  • Bruno技术深度解析:API测试工具的架构革新与实践
  • EmotiVoice语音个性档案系统设计构想
  • EmotiVoice能否生成动物叫声拟人化语音?趣味实验展示
  • Taiga开源敏捷项目管理工具:从零到精通的终极实践指南
  • 40、邮件规则集定义与垃圾邮件过滤指南
  • 重磅发布!2025年广东视觉检测设备权威测评榜单 - 一搜百应
  • 域控操作十六:开启电脑指纹解锁
  • 2025温州婚纱店推荐星级排名及选择指南 - 提酒换清欢
  • Docker 权限问题:为什么容器里读不到文件?
  • 树的价值
  • 域控操作十五:开启域控范围内所有电脑的远程桌面,并将当前登录用户添加进远程桌面权限组