2)第58页_时间平移爱情法则
字体:      护眼 关灯
上一章 目录 下一章
  过屏幕,专注而深情的凝视着她——

  她的耳边忽然响起那个低哑的女声:如果你拥有了一张他的照片,在你的世界里,再没有其他人;当你拥有了更多他的照片,你就进入了他的世界。

  初听到这个说法时,她很不以为然。

  当她现在注视着这张照片,注视着他眉眼间的温柔,那句话便犹如魔音,萦绕在她的耳边。

  她忘记了镜头外还有另一个女人。

  他的温柔都是给她的。

  作者有话要说:

  无脑小炮灰一只~~~~~

  第35章35

  从进公司后就无所事事的韩念初,终于回到了原来时空的工作状态。

  跟专家的会议时间定在半个月后,有意向的投资人和股东都会到场,会议的核心主题将决定人工智能未来的研究发展发向,是继续研究语法树,还是兴起不久的深度学习研究。

  秘书的事务已无暇顾及,何谨修倒没说什么,让HR再借调一个人手过来。

  韩念初几乎都泡在实验室里,跟周严果讨论,写代码,刘铭亲自坐镇,也要了张办公桌,和他们一起办公。

  周严果站在白板前说:“在现有语料库的基础上,假设我们把状态价值函数和动作价值函数定义好,加入现有的代码模块,实现有监督的学习。”

  刘铭问:“具体怎么实现?”

  周严果说:“这就是今天讨论的目的,集思广益,讨论出这个方法的可行性。”

  何谨修捏着笔,不知为何,他的目光转向了韩念初。

  韩念初走到周严果旁边,接过他的笔,在白板上写满了公式,转身说道:“用贝尔曼方程迭代计算奖惩。”

  众人一愣。

  韩念初接着说道:“具体一点,先定义状态价值函数,用来评估状态优劣。行为或动作价值函数用于评估下一个字或词的优劣。完成定义后,进一步定义出累计奖励函数,就可以评价出一整句回答的优劣。”

  “奖励函数怎么定义?这个函数接受的变量怎么从人传给机器?这个变量给了函数以后,函数怎么去调整它的输出?答好要加多少分?答不好要扣多少分?那个奖励函数怎么解?”周严果一口气问出了一连串的问题。

  韩念初在白板上一边划线一边讲解:“想想公式怎么定义,根据公式把奖惩机制加进源代码,测试一下就行了。我说明白了吗?”

  请收藏:https://m.bl56.cc

(温馨提示:请关闭畅读或阅读模式,否则内容无法正常显示)

上一章 目录 下一章