初学者,学习完基础知识后有一些问题,请教一下论坛里机器学习方面的大佬。
1 、我想做个试手项目,比如利用机器学习对 1920*1080 的图片进行锐化。因为数据集非常好获取,锐化随便就可以算,感觉是个比较好上手的项目。我在学习的过程中见过线性回归(输出一个值,然后利用 MSELoss 计算损失),以及分类(输出 10 个值,softmax+交叉熵)两种输出模式,如果想由图片得到图片的话应该如何定义输出呢?比如要得到 n*m 的图片,难道输出值是一个 n*m 的矩阵,然后计算每个像素和目标值的平均差值吗?
2 、如果上述网络做完之后,比如训练是 16:9 的图片训练的,实际生产环境需要输入 21:9 的图片又该怎么办呢?我的一个想法是比如统一训练 256*256 的输入,然后无论图片多大,统一裁成若干个标准块输入。不过这种情况的话不会在接缝处产生一个不和谐的缝隙吗?
3 、目前这类图片转换滤镜的需求,有什么成熟的(免费可获取的)已经训练好的网络,可供迁移过来进行微调吗?
4 、和上述问题无关,我思考想要做的项目时产生一个疑问,就是如何统合一些完全不相干的信息,比如如果要利用我的个人信息预测我的收入,那么我的父母、兄弟、朋友,作为不同的自然人,他们每个人的职业年龄等信息可以预测出一个他们的个人数据,然后如果要和我产生联系的话,要如何把这一些(不确定数量的,且互相比较独立的)数据在网络中统合起来呢?
我有考虑过直接把所有数据 Flatten 变成一层并相加,但是总感觉不太合逻辑。而且关系上来讲,比如父母这种的影响肯定比朋友大,如果直接拉成一条线然后用 cnn 预测的话,那岂不是说有一个有钱的朋友和有一个有钱的父母对于网络来说效果是一样的,这不合逻辑。
===========================
谢谢大家!
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.