代码如下:
#encoding: utf-8
import tensorflow as tf
from numpy.random import RandomState
# 获取一层神经网络边上的权重,并将这个权重的 L2 正则化损失加入名称为'losses'的集合中
def get_weight(shape, lambdaF):
var = tf.Variable(tf.random_normal(shape))
# add_to_collection 函数将这个新生成变量的 L2 正则化损失加入集合。
# 这个函数的第一个参数'losses', 是集合的名字,第二个参数是要加入这个集合的内容
tf.add_to_collection('losses', tf.contrib.layers.l2_regularizer(lambdaF)(var))
return var
x = tf.placeholder(tf.float32, shape=(None, 2), name='x-input')
y_ = tf.placeholder(tf.float32, shape=(None, 1), name='y-input')
batch_size = 8
# 定义了每一层网络中节点的个数
layer_dimension = [2, 10, 10, 10, 1]
# 神经网络的层数。
n_layers = len(layer_dimension)
# 这个变量维护前向传播时最深层的节点,开始的时候就是输入层。
cur_layer = x
# 当前层的节点个数
in_dimension = layer_dimension[0]
# 通过一个循环来生成 5 层全连接的神经网络结构
for i in range(1, n_layers):
# layer_dimension[i]为下一层的节点个数。
out_dimension = layer_dimension[i]
# 生成当前层中权重的变量,并将这个变量的 L2 正则化损失加入计算图上的集合。
weight = get_weight([in_dimension, out_dimension], 0.001)
bias = tf.Variable(tf.constant(0.1, shape=[out_dimension]))
# 使用 ReLU 激活函数
cur_layer = tf.nn.relu(tf.matmul(cur_layer, weight) + bias)
# 进入下一层之前将下一层的节点数更新为当前层节点个数
in_dimension = layer_dimension[i]
# 在定义神经网络前向传播的同时已经将所有的 L2 正则化损失加入图上的集合,
# 这里只需要计算刻画模型在训练数据上表现的损失函数
mse_loss = tf.reduce_mean(tf.square(y_ - cur_layer))
# 将均方误差损失函数加入损失集合
tf.add_to_collection('losses', mse_loss)
# get_collection 返回一个列表, 这个列表是所有这个集合的元素。在这个样例中,
# 这些元素就是损失函数的不同部分,将它们加起来就可以得到最终的损失函数
loss = tf.add_n(tf.get_collection('losses'))
tran = tf.train.AdamOptimizer().minimize(loss)
rdm = RandomState(1)
dataset_size = 12800
X = rdm.rand(dataset_size, 2)
Y = [ (x1*x2 + rdm.rand()/10.0 - 0.05,) for (x1, x2) in X]
with tf.Session() as sess:
sess.run(tf.global_variables_initializer())
STEPS = 1500000
for i in range(STEPS):
start = (i * batch_size) % dataset_size
end = min(dataset_size, start+batch_size)
sess.run(tran, feed_dict={x:X[start:end], y_:Y[start:end]})
if i % 200 == 0:
print(sess.run(loss, feed_dict={x:X, y_:Y}))
主要疑问是:
X = rdm.rand(dataset_size, 2)
Y = [ (x1*x2 + rdm.rand()/10.0 - 0.05,) for (x1, x2) in X]
为什么,那些权重参数,能拟合出 X 和 Y 的映射关系,Y 是等于 x1*x2,这一点也不线性啊
运行了下,loss 可以小到 0.0035882844
这是一个专为移动设备优化的页面(即为了让你能够在 Google 搜索结果里秒开这个页面),如果你希望参与 V2EX 社区的讨论,你可以继续到 V2EX 上打开本讨论主题的完整版本。
V2EX 是创意工作者们的社区,是一个分享自己正在做的有趣事物、交流想法,可以遇见新朋友甚至新机会的地方。
V2EX is a community of developers, designers and creative people.