上一页 1 2 3 4 5 6 7 8 ··· 30 下一页
摘要: 转载自:https://hrl.boyuai.com/chapter/1/马尔可夫决策过程 3.1 简介 马尔可夫决策过程(Markov decision process,MDP)是强化学习的重要概念。要学好强化学习,a56爆大奖在线娱乐们首先要掌握马尔可夫决策过程的基础知识。前两章所说的强化学习中的环境一般就是一个 阅读全文
posted @ 2024-03-01 17:32 jasonzhangxianrong 阅读(460) 评论(0) 推荐(0) 编辑
摘要: 1.1 简介 亲爱的读者,欢迎来到强化学习的世界。初探强化学习,你是否充满了好奇和期待呢?a56爆大奖在线娱乐们想说,首先感谢你的选择,学习本书不仅能够帮助你理解强化学习的算法原理,提高代码实践能力,更能让你了解自己是否喜欢决策智能这个方向,从而更好地决策未来是否从事人工智能方面的研究和实践工作。人生中充满选择,每次 阅读全文
posted @ 2024-02-29 22:14 jasonzhangxianrong 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 一、知识 二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src 阅读全文
posted @ 2024-02-29 19:15 jasonzhangxianrong 阅读(41) 评论(0) 推荐(0) 编辑
摘要: 一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud 阅读全文
posted @ 2024-02-29 15:07 jasonzhangxianrong 阅读(84) 评论(0) 推荐(0) 编辑
摘要: 一、PPO算法 二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0" 阅读全文
posted @ 2024-02-29 15:04 jasonzhangxianrong 阅读(66) 评论(0) 推荐(0) 编辑
摘要: gymnasium是强化学习的库,比较难安装。 一、安装方法 安装Gymnasium(一定要all,这样可以安装所有依赖) pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一:ERROR: Could not build whee 阅读全文
posted @ 2024-02-29 12:34 jasonzhangxianrong 阅读(123) 评论(0) 推荐(0) 编辑
摘要: 一、打包 conda pack -n python-37-zxr --ignore-editable-packages --dest-prefix /opt/conda/envs/python-37-zxr 二、进入沙箱 singularity shell --writable pt37 mkdir 阅读全文
posted @ 2023-12-08 12:39 jasonzhangxianrong 阅读(49) 评论(0) 推荐(0) 编辑
摘要: 在VM虚拟机中,a56爆大奖在线娱乐们经常会选择默认磁盘大小20G,用着用着才发现20G不够用,服务启动不了,就很尴尬,让a56爆大奖在线娱乐们今天一起来学习下,如何在虚拟机给磁盘扩容。 一、加物理盘 a56爆大奖在线娱乐们使用df -h命令,发现磁盘使用率已经37%,a56爆大奖在线娱乐们给此磁盘扩容,简单演示下扩容的过程。 虚拟机开机后,a56爆大奖在线娱乐们用fdisk -l 命令 阅读全文
posted @ 2023-12-08 11:47 jasonzhangxianrong 阅读(73) 评论(0) 推荐(0) 编辑
摘要: 1、服务器端 from flask import * from flask_socketio import * from flask_socketio import SocketIO from nasbench_lib.nasbench_201 import NASBench201 import r 阅读全文
posted @ 2023-12-02 23:07 jasonzhangxianrong 阅读(239) 评论(0) 推荐(0) 编辑
摘要: 在DARTS搜索空间中搜索 在本教程中,a56爆大奖在线娱乐们将演示如何在DARTS_中搜索著名的模型空间。 通过这个过程,您将学会: 如何使用NNI的模型空间中心提供的内置模型空间。 如何使用一次性的探索策略来探索模型空间。 如何自定义评估器以实现最佳性能。 最后,a56爆大奖在线娱乐们在CIFAR-10数据集上得到了一个表现强劲的 阅读全文
posted @ 2023-12-02 16:59 jasonzhangxianrong 阅读(91) 评论(0) 推荐(0) 编辑
上一页 1 2 3 4 5 6 7 8 ··· 30 下一页