V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
magic3584
V2EX  ›  问与答

怎么保证文件夹名字不含特殊字符和适配多语言?

  •  
  •   magic3584 · 2023-12-10 23:37:40 +08:00 · 1139 次点击
    这是一个创建于 373 天前的主题,其中的信息可能已经有所发展或是发生改变。

    我想根据一个 String 去创建文件夹,这个 String 可能包含特殊字符,并且是各种语言,我怎么去处理才能保证可行性和唯一性。

    测试了下 Mac 上的:

    1. 汉字 1 ,pwd 实际为:汉字\ 1
    2. /n/1, pwd 实际为::n:1

    使用 url encode 和 unicode 和话感觉有点长

    6 条回复    2023-12-11 10:12:55 +08:00
    magic3584
        1
    magic3584  
    OP
       2023-12-11 00:06:06 +08:00
    微信的好像是加盐后的 md5
    natsukage
        2
    natsukage  
       2023-12-11 00:08:20 +08:00 via iPhone
    你总得说下环境啊。。
    比如 c#自己就有获取路径/文件夹名中不合法字符的方法

    string invalidChars = new string(Path.GetInvalidFileNameChars()) + new string(Path.GetInvalidPathChars());
    string validName = Regex.Replace(name, "[" + Regex.Escape(invalidChars) + "]", "");

    这样可以简单地过滤掉所有不合法字符。
    至于你想 throw ,改成下划线,重命名为 GUID 之类的就取决于你具体的业务逻辑了
    magic3584
        3
    magic3584  
    OP
       2023-12-11 00:16:59 +08:00
    @natsukage #2
    辛苦大佬手机还要手撸代码
    我目前是想在手机上用命令创建文件夹,但是还是想了解下除了这个平台外,其它平台是如何做这块的
    renmu
        4
    renmu  
       2023-12-11 00:32:36 +08:00 via Android
    遍历不可用于命名的字符,然后换掉或者扔掉都可以
    NoOneNoBody
        5
    NoOneNoBody  
       2023-12-11 00:55:42 +08:00
    关键是系统编码,以及系统定义的不可用于路径的字符,不同系统略有不同
    utf-8 以及读取时也是 utf-8 应该问题不大,除非用了扩展字符集,例如汉字的古体或几乎难以见到的生僻字
    如果是 GBK 或中欧字符编码就麻烦了,一般可以通过转码 latin-1 ,然后和系统定义的排除排除字符比较
    例如 GBK 的“東”字
    windows 好象是混合编码,很麻烦,一般需要 api 处理,还好各大语言都有比较完善的路径模块提供
    zjyl1994
        6
    zjyl1994  
       2023-12-11 10:12:55 +08:00
    一般来说需要处理的都是空格变下划线,路径分隔符用到的斜杠也要转掉,windows 平台要额外处理冒号。似乎别的也就没什么了。如果想实现完美一些的话可以考虑查一下文件系统禁用的符号,ntfs/apfs/ext4 这几个的都看一看能覆盖不少用户范围了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   3571 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 22ms · UTC 04:30 · PVG 12:30 · LAX 20:30 · JFK 23:30
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.