V2EX = way to explore
V2EX 是一个关于分享和探索的地方
现在注册
已注册用户请  登录
V2EX 提问指南
ericgui
V2EX  ›  问与答

文件格式的解析问题

  •  
  •   ericgui · 2016-10-12 01:07:25 +08:00 · 1480 次点击
    这是一个创建于 2958 天前的主题,其中的信息可能已经有所发展或是发生改变。

    各位大侠,我目前在研究一个小问题: 我在工作中经常遇到一些乱七八糟后缀的文件,都是各类机器生成的,文件也不大,小到几 k ,大的也就几 M ,就是后缀种类比较多。 而且要解析这些文件,还 TM 安装一堆厂商自带的各种软件,别的不说,一个软件好几百 M ,甚至上 G , 电脑实在受不了,主要是没钱,买的 ssd 比较小, 所以想自己撸一个小轮子,能解析这些小文件,

    我的问题是: 一般解决这样的问题,有什么样的思路,有什么需要用到的技术? 本人技术比较菜,但比较喜欢钻研,求各位给点提示,给几个关键词,我去 google 一下,自己一点一点搞。

    谢过了!

    实在找不到合适的节点,就选了 V2EX ,如果选错了,先说声对不起。

    打算撸好之后开源, License 选 MIT ,要是哪个公司想拿去赚钱,也不拦着。

    当然,我最担心的是,这些都是未授权解析人家的文件格式,我这算侵权吗?

    3 条回复    2016-10-12 12:53:20 +08:00
    imn1
        1
    imn1  
       2016-10-12 01:15:04 +08:00
    选 问与答 节点就可以了

    如果文件是开放的,解析应该没问题,如果是加密的,你去破就难说了
    binux
        2
    binux  
       2016-10-12 01:19:28 +08:00
    类似于我捡到一个轮子怎么造一辆车?
    这里面重要的不是解析那个文件,而是解析了之后怎么处理那些数据。
    而处理那些数据,就是要好几百 M ,甚至上 G 。你一个轮子好几百 G 吗?
    ericgui
        3
    ericgui  
    OP
       2016-10-12 12:53:20 +08:00
    @binux 生产机器的厂家自带的软件,除了识别他们自己机器生成的文件格式,更重要的是用于控制自己的那台机器。所以如果厂家的软件是开源的,其实可以把单独识别文件格式的部分剥离出来,其他的部分就不要了。但显然人家厂家的软件是不开源的,要想解析机器生成的文件格式,必须安装整个一个软件。我硬盘太小,这样乱七八糟的机器格式又太多,硬盘安装不下。所以才出此下策。要是买机械硬盘吧,固然容量很大,但打开软件的速度慢死了。
    关于   ·   帮助文档   ·   博客   ·   API   ·   FAQ   ·   实用小工具   ·   1648 人在线   最高记录 6679   ·     Select Language
    创意工作者们的社区
    World is powered by solitude
    VERSION: 3.9.8.5 · 23ms · UTC 16:38 · PVG 00:38 · LAX 08:38 · JFK 11:38
    Developed with CodeLauncher
    ♥ Do have faith in what you're doing.