《深度学习入门:基于Python的理论与实现》 卷积神经网络[日]斋藤康毅 卷积神经网络(Convolutional Neural Network,CNN)。CNN被用于图像识别、语音识别等各种场合,在图像识别的比赛中,基于深度学习的方法几乎都以CNN为基础。 卷积神经网络整体结构全连接(fully ...
深度学习入门-误差反向传播法
《深度学习入门:基于Python的理论与实现》 误差反向传播法[日]斋藤康毅 误差反向传播法有两种方法:一种是基于数学式;另一种是基于计算图(computational graph)。 计算图计算图将计算过程用图形表示出来。这里说的图形是数据结构图,通过多个节点和边表示(连接节点的直线称为“边”) ...
深度学习入门-感知机和神经网络4-学习
《深度学习入门:基于Python的理论与实现》 神经网络的学习 [日]斋藤康毅 从数据中学习深度“学习”是指从训练数据中自动获取最优权重参数的过程。学习的目的就是以损失函数为基准,找出能使它的值达到最小的权重参数。 数据是机器学习的命根子。从数据中寻找答案、从数据中发现模式、根据数据讲故事……这些机 ...
深度学习入门-感知机和神经网络
《深度学习入门:基于Python的理论与实现》1-3章 [日]斋藤康毅 感知机感知机是由美国学者Frank Rosenblatt在1957年提出来的。 感知机接收多个输入信号,输出一个信号。这里所说的“信号”可以想象成电流或河流那样具备“流动性”的东西。 感知机的信号只有“流/不流”(1/0)两种取 ...
Rust的Tokio库
Tokio官网地址 教程地址 这个教程实现了简单的redis服务端和客户端。 Tokio是rust语言的一个异步运行时,它包括以下组件: 执行异步代码的多线程运行时 标准库的异步版本 大量的库生态系统,基于它有许多子库项目 什么情况不需要Tokio? rust主要用于IO密集的应用,对于CPU密 ...
Obsidian 使用
基本语法LinkText 使用[LinkText](URL)创建仓库外的链接 ==高亮文本== 使用==内容==来让内容高亮显示 删除线内容 使用~~删除内容~~来使用删除线 To Do is Done 使用-[ ]创建一个复选框 如果把括号中空格换成x,表示勾选 -[x] [[obsidi ...
从零构建大模型-LoRA微调
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 附录E 使用LoRA进行参数高效微调LoRA(低秩自适应)是应用最广泛的参数高效微调技术之一。 LoRA简介LoRA是一种通过仅调整模型权重参数的一小部分, ...
从零构建大模型-针对分类微调
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第七章 指令微调 在开发用于聊天机器人应用程序、个人助理和其他对话任务的大语言模型时,指令微调是主要技术之一 指令微调的三阶段:第一阶段准备数据集,第二阶段 ...
从零构建大模型-针对分类微调
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第六章 针对分类微调6.1 微调分类微调语言模型最常见的方法是指令微调和分类微调 指令微调涉及使用特定的指令数据对一组任务进行训练,以提高语言模型理解和执行 ...
从零构建大模型-训练模型
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第五章 训练模型(无标签数据)模型训练过程就是调整模型中的权重参数,大语言模型以及其他深度学习模型的背景下,权重一般指的是学习过程调整的可训练参数。这些权重 ...