jasonzhangxianrong - 博客园_a56爆大奖在线娱乐

2024年3月1日

摘要：转载自：https://hrl.boyuai.com/chapter/1/马尔可夫决策过程 3.1 简介马尔可夫决策过程（Markov decision process，MDP）是强化学习的重要概念。要学好强化学习，a56爆大奖在线娱乐们首先要掌握马尔可夫决策过程的基础知识。前两章所说的强化学习中的环境一般就是一个阅读全文

posted @ 2024-03-01 17:32 jasonzhangxianrong 阅读(460) 评论(0) 推荐(0) 编辑

2024年2月29日

动手学强化学习（一）：初探强化学习

摘要： 1.1 简介亲爱的读者，欢迎来到强化学习的世界。初探强化学习，你是否充满了好奇和期待呢？a56爆大奖在线娱乐们想说，首先感谢你的选择，学习本书不仅能够帮助你理解强化学习的算法原理，提高代码实践能力，更能让你了解自己是否喜欢决策智能这个方向，从而更好地决策未来是否从事人工智能方面的研究和实践工作。人生中充满选择，每次阅读全文

posted @ 2024-02-29 22:14 jasonzhangxianrong 阅读(73) 评论(0) 推荐(0) 编辑

强化学习（五）：A3C

摘要：一、知识二、代码 1、6个py文件 2、train.py import os os.environ['OMP_NUM_THREADS'] = '1' import argparse import torch from src.env import create_train_env from src 阅读全文

posted @ 2024-02-29 19:15 jasonzhangxianrong 阅读(41) 评论(0) 推荐(0) 编辑

强化学习（四）：PPO连续

摘要：一、PPO连续 import torch import torch.nn as nn from torch.distributions import MultivariateNormal import gym import numpy as np device = torch.device("cud 阅读全文

posted @ 2024-02-29 15:07 jasonzhangxianrong 阅读(84) 评论(0) 推荐(0) 编辑

强化学习（三）：PPO

摘要：一、PPO算法二、PPO代码 import torch import torch.nn as nn from torch.distributions import Categorical import gymnasium as gym device = torch.device("cuda:0" 阅读全文

posted @ 2024-02-29 15:04 jasonzhangxianrong 阅读(66) 评论(0) 推荐(0) 编辑

强化学习（二）：安装gym.

摘要： gymnasium是强化学习的库，比较难安装。一、安装方法安装Gymnasium（一定要all，这样可以安装所有依赖） pip install gymnasium[all]pip install gymnasium[all] 二、报错信息一：ERROR: Could not build whee 阅读全文

posted @ 2024-02-29 12:34 jasonzhangxianrong 阅读(123) 评论(0) 推荐(0) 编辑

2023年12月8日

(五)conda环境打包给沙箱环境

摘要：一、打包 conda pack -n python-37-zxr --ignore-editable-packages --dest-prefix /opt/conda/envs/python-37-zxr 二、进入沙箱 singularity shell --writable pt37 mkdir 阅读全文

posted @ 2023-12-08 12:39 jasonzhangxianrong 阅读(49) 评论(0) 推荐(0) 编辑

(四)虚拟机下linux磁盘扩容

摘要：在VM虚拟机中，a56爆大奖在线娱乐们经常会选择默认磁盘大小20G，用着用着才发现20G不够用，服务启动不了，就很尴尬，让a56爆大奖在线娱乐们今天一起来学习下，如何在虚拟机给磁盘扩容。一、加物理盘 a56爆大奖在线娱乐们使用df -h命令，发现磁盘使用率已经37%，a56爆大奖在线娱乐们给此磁盘扩容，简单演示下扩容的过程。虚拟机开机后，a56爆大奖在线娱乐们用fdisk -l 命令阅读全文

posted @ 2023-12-08 11:47 jasonzhangxianrong 阅读(73) 评论(0) 推荐(0) 编辑

2023年12月2日

python并行之flask-socketio

摘要： 1、服务器端 from flask import * from flask_socketio import * from flask_socketio import SocketIO from nasbench_lib.nasbench_201 import NASBench201 import r 阅读全文

posted @ 2023-12-02 23:07 jasonzhangxianrong 阅读(239) 评论(0) 推荐(0) 编辑

DARTS搜索空间

摘要：在DARTS搜索空间中搜索在本教程中，a56爆大奖在线娱乐们将演示如何在DARTS_中搜索著名的模型空间。通过这个过程，您将学会：如何使用NNI的模型空间中心提供的内置模型空间。如何使用一次性的探索策略来探索模型空间。如何自定义评估器以实现最佳性能。最后，a56爆大奖在线娱乐们在CIFAR-10数据集上得到了一个表现强劲的阅读全文

posted @ 2023-12-02 16:59 jasonzhangxianrong 阅读(91) 评论(0) 推荐(0) 编辑

公告