作业2搭建了一个字符级的语言模型,来生成恐龙的名字。
Part2:Character level language model - Dinosaurus land
模型结构
- 初始化参数
- 执行最优化循环
- 计算前向传播的损失函数
- 计算反向传播的梯度及损失函数
- 剪裁梯度避免梯度爆炸
- 使用梯度更新梯度下降中的各参数
- 返回学习到的参数
梯度裁剪
确保不会梯度爆炸
1 | ### GRADED FUNCTION: clip |
采样
现在假设你的模型已经训练好了,你需要以此生成新的字母,过程如下:
1 | # GRADED FUNCTION: sample |
构建模型
函数都已经给你了
1 | # GRADED FUNCTION: optimize |
训练模型
1 | # GRADED FUNCTION: model |