强化学习-part1

it2024-06-29  44

第一章 概括与基础

datawhale组对学习part1

学习方式:通过观看b站up主博磊的强化学习视频,完成习题

视频: 概括与基础 上:https://www.bilibili.com/video/BV1LE411G7Xj 概括与基础 下:https://www.bilibili.com/video/BV1g7411Z7SJ

强化学习概念:agent在一个环境中 极大化获得奖励

强化学习的困难: (对比监督学习) 1.样本并不是互相独立的 2.不能立刻得到反馈,没有标签说明是否每一步骤是对错,只有当游戏结束才会有结果 3.通过不断试错获得提升 4.告诉你行为错误,但并未告诉正确行为是什么,而且可能是一段时间后才有反馈

强化学习的特点: 1.需要在环境里学习,获得对环境的经验

最新回复(0)