个人背景
本科学过一点计算机应用的科目,接触过一点 VBA 和 python 的编程知识,软件开发属于民科+菜鸟水平。
用户需求
公司分好几个部门,分布在不同地理位置,内网没有 ftp 服务,也没有跨部门的文件共享服务。大部分的内网用户不能访问互联网,但全部用户都可以访问 21cn 的企业邮箱(容量只有 4M )。想发大的文件给别的部门的同事,只能提前通知对方清理邮箱或者发到私人邮箱。
战略层
计划用 django 开发一个文件的中转系统,让用户上传文件,生成下载链接。用户把下载链接通过邮件发给收件人,对方点击链接就可以下载文件。 架构大概是 freebsd + python + django + uwsgi + nginx
这一层考虑的意外情况有: 1、文件同名 文件上传时,对“日期+文件名”用 hashlib 库做 10 bit 的 blake2b digest,得到的字符串作为文件的唯一 id,也是储存在服务器目录的文件名。下载链接是 http://IP-ADDRESS/app/get/file-id,然后 django 从数据库查到文件上传时候的名字和实际储存的路径,再传递给 nginx,nginx 在把储存的文件重命名提供给用户。
2、文件内容重复 每天下班之后,django 跑一个后台程序,对储存在服务器的文件,未有 hash 值的,做 hash。发现相同 hash 值的文件的话,将新上传的文件的物理储存路径改为已有的文件,删除掉新上传的文件。用户下载的时候可以下载到正确的文件名和内容,系统的储存空间也不会浪费。当然,只有在用户大量上传文件,导致储存空间不够用的时候才需要清理重复的文件。
3、用户上传和下载大文件,占用跨部门网络链接的带宽 部门内部是百兆到桌面,服务器部署在部门 A,部门 A 的对外链接只有 6M 带宽。针对来自不同部门的用户进行上传和下载的限速。限速功能实现之前,通过文字提醒用户不要上传下载超过 200M 的文件。
功能层
1.0 版本: 在首页展示使用说明 接受上传文件 操作日志存入数据库 按日期倒序,展示同一 ip 上传的文件列表,可以删除 通过链接可以下载
2.0 版本: 限速 搜索 管理员页面,可以删除任何文件
3.0 版本: 各种统计信息,访问量、文件数量、下载次数等等 上传的进度条
由于没有什么知识和经验,总是担心这些粗浅的想法有错漏,希望各位高手不吝赐教,谢谢!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.