秋无痕淘宝天猫优惠券网	秋无痕常用软件全功能装机光盘 2023年金秋版	秋无痕一键优化Windows 10专版	秋无痕一键优化Windows 11专版
秋无痕论坛官方QQ群	获取无痕币和提高等级

主题 : DeepMind大动作！开源开发AI项目的元件函式库

使用道具 | 复制链接 | 浏览器收藏 | 打印

加为好友

hexj9

千山同一月万户尽皆春千江有水千江月万里无云万里天

级别: 总版主

作者资料发送短消息

UID: 998
精华: 0
发帖: 605059
威望: 529688 点
无痕币: 0 WHB
贡献值: 0 点
在线时间: 62612(时)
注册时间: 2008-12-25
最后登录: 2024-05-19

0 发表于: 2018-10-24 10:33｜请将IE368导航设置为首页，支持论坛

只看楼主 | 小中大

0 DeepMind大动作！开源开发AI项目的元件函式库

据中国台湾地区媒体报道，Alphabet旗下AI子公司DeepMind周四开源释出可撰写TensorFlow强化学习（Reinforcement Learning，RL）代理程式的函式库TRFL。

DeepMind指出，TRFL（念作truffle）集结了该公司内部开发代理程式如DQN、DDPG及Importance Weighted Actor Learner Architecture所有的重要演算法元件。TRFL目前已可在GitHub上开放下载。
一般强化学习代理程式包含许多互动元件，像是环境和某个表示值（values）或政策（policy）的深度网路，以及该环境的学习模型、伪奖励函式或重播系统（replay system）。这些元件互动很巧妙，因而在大型运算图谱（computation graphs）中不易发现Bug。Open AI最近就分析强化学习代理程式最受欢迎的开源实作发现，10个代理程式有6个有很小的瑕疵被社区发现且经作者证实。
解决上述问题及协助研究的方法之一是将完整的代理程式实作开源出来。这些代理程式的程式码对复制研究很有用，但问题是难以修改和扩充。另一个方法则是将共通建构元件、经测试过的稳定实作提供出来，这些共通元件也可用于众多不同的RL代理程式。另一个好处是，将这些核心元件集结于单一函式库，加上一致化的API，将更容易和不同来源的想法结合。
TRFL函式库包括实作传统RL演算及更先进技术的函式。像是loss函式及其他运算都有实作于纯Tensorflow之中。针对value-based及policy-base的强化学习，TRFL也都提供了相应的工具。
DeepMind表示，由于这个函式库广泛用于DeepMind开发上，因此他们会持续维护并新增功能，且可望继续释出给开源社区。
本项目势必受到开发人员的欢迎。根据近日GitHub的统计，Tensorflow是平台上第三大开源项目，仅次于微软VS Code和脸书React。

来自：评分选定顶端

回复引用评分

加为好友

lxr1182