摘要: 最近搞了一个prometheus 指标终端展示工具,有兴趣的可以试试: 阅读全文
posted @ 2024-06-29 01:00 charlieroro 阅读(10) 评论(0) 推荐(0) 编辑
摘要: 一个无竞争的缓存 目录一个无竞争的缓存Cache定义数据节点的创建hashmaps3-FIFODqueuereadBufferswritebufferNode 过期策略可变过期策略Variable的初始化删除过期数据添加数据Cache的Set & GetSetGet事件和过期数据的处理事件处理清理过 阅读全文
posted @ 2024-04-28 17:07 charlieroro 阅读(281) 评论(0) 推荐(0) 编辑
摘要: S3-FIFO a56爆大奖在线娱乐作为下一篇缓存文章的预备知识。 背景 基于LRU和FIFO的驱逐 FIFO和LRU都是经典的缓存驱逐算法,在过去几十年中也出现了很多追求更高效率的驱逐算法,如ARC, 2Q, LIRS, TinyLFU。传统观点认为,基于LRU的缓冲未命中率要低于基于FIFO的算法,如CLOCK 阅读全文
posted @ 2024-04-25 14:20 charlieroro 阅读(109) 评论(0) 推荐(0) 编辑
摘要: RAG系列 a56爆大奖在线娱乐介绍了RAG以及RAG pipeline的整个流程,包括请求转换、路由和请求构造、索引和检索、生成和评估等,其中引用了大量有价值的论文。 参考Advanced RAG Series: Generation and Evaluation中的5篇文章,并丰富了相关内容。 请求转换 请求转 阅读全文
posted @ 2024-04-01 09:29 charlieroro 阅读(1263) 评论(0) 推荐(1) 编辑
摘要: 向量数据库与LLM的集成:实践指南 a56爆大奖在线娱乐将了解到什么是向量数据库,以及如何与LLMs进行集成。通过LLMs和向量数据库的结合,可以节省微调带来的开销和时间。 通常,LLM会在各种各样的数据上进行训练,这使它们具有广泛的理解能力,但可能会导致在特定的知识领域存在差距。有时,它们甚至可能产生与目标无关或 阅读全文
posted @ 2024-03-15 17:46 charlieroro 阅读(705) 评论(0) 推荐(1) 编辑
摘要: 2024年大语言模型的微调 在上一篇博客中了解了LLM的由来以及基本流程,其中会涉及到几个概念:Prompt Engineering、model、dataset、 vector-database、training、fine-tune、 library等。鉴于本人是小白,后面将引用几篇典型的文章来熟悉 阅读全文
posted @ 2024-03-07 10:57 charlieroro 阅读(1084) 评论(0) 推荐(2) 编辑
摘要: 理解LLMOps: Large Language Model Operations 对于像a56爆大奖在线娱乐一样的小白来说,a56爆大奖在线娱乐是一篇非常不错的LLMs入门介绍文档。来自:Understanding LLMOps: Large Language Model Operations a56爆大奖在线娱乐首先解释了新术语"LLMOps" 阅读全文
posted @ 2024-03-05 17:51 charlieroro 阅读(579) 评论(0) 推荐(0) 编辑
摘要: Kubernetes 1.29版本中已经将nftables作为一个featureGates,a56爆大奖在线娱乐简单整理了nftables的用法,便于后续理解kubernetes的nftables规则。文末给出了使用kubeadm部署启用nftables featureGates的配置文件。 如下内容来源nftab 阅读全文
posted @ 2024-01-30 09:38 charlieroro 阅读(1089) 评论(0) 推荐(1) 编辑
摘要: Logstash 目录LogstashMonitoring APINode Info APIPlugins Info APINode Stats APIHot Threads APIlogstash exporter指标插件管理离线安装插件更新插件移除插件使用Gem私有库性能调优Troublesho 阅读全文
posted @ 2024-01-25 09:49 charlieroro 阅读(631) 评论(0) 推荐(4) 编辑
摘要: 限速器 限速模拟器 限速器类型 Leaky Bucket:漏桶算法(和令牌桶(token bucket)非常相似)是a56爆大奖在线娱乐非常简单,使用队列来进行限流的算法。当接收到一个请求时,会将其追加到队列的末尾,系统会按照先进先出的顺序处理请求,一旦队列满,则会丢弃额外的请求。队列中的请求数目受限于队列的大小。 阅读全文
posted @ 2023-12-27 23:36 charlieroro 阅读(289) 评论(0) 推荐(1) 编辑