深度学习入门-卷积神经网络

发表于 2025-10-08 | 分类于 AI

《深度学习入门：基于Python的理论与实现》卷积神经网络[日]斋藤康毅卷积神经网络(Convolutional Neural Network，CNN)。CNN被用于图像识别、语音识别等各种场合，在图像识别的比赛中，基于深度学习的方法几乎都以CNN为基础。卷积神经网络整体结构全连接(fully ...

阅读全文 »

深度学习入门-误差反向传播法

发表于 2025-10-05 | 更新于 2025-10-08 | 分类于 AI

《深度学习入门：基于Python的理论与实现》误差反向传播法[日]斋藤康毅误差反向传播法有两种方法：一种是基于数学式；另一种是基于计算图(computational graph)。计算图计算图将计算过程用图形表示出来。这里说的图形是数据结构图，通过多个节点和边表示（连接节点的直线称为“边”） ...

阅读全文 »

深度学习入门-感知机和神经网络4-学习

发表于 2025-10-03 | 更新于 2025-10-08 | 分类于 AI

《深度学习入门：基于Python的理论与实现》神经网络的学习 [日]斋藤康毅从数据中学习深度“学习”是指从训练数据中自动获取最优权重参数的过程。学习的目的就是以损失函数为基准，找出能使它的值达到最小的权重参数。数据是机器学习的命根子。从数据中寻找答案、从数据中发现模式、根据数据讲故事……这些机 ...

阅读全文 »

深度学习入门-感知机和神经网络

发表于 2025-10-02 | 更新于 2025-10-08 | 分类于 AI

《深度学习入门：基于Python的理论与实现》1-3章 [日]斋藤康毅感知机感知机是由美国学者Frank Rosenblatt在1957年提出来的。感知机接收多个输入信号，输出一个信号。这里所说的“信号”可以想象成电流或河流那样具备“流动性”的东西。感知机的信号只有“流/不流”(1/0)两种取 ...

阅读全文 »

Rust的Tokio库

发表于 2025-10-01 | 更新于 2025-10-08 | 分类于 rust

Tokio官网地址教程地址这个教程实现了简单的redis服务端和客户端。 Tokio是rust语言的一个异步运行时，它包括以下组件：执行异步代码的多线程运行时标准库的异步版本大量的库生态系统，基于它有许多子库项目什么情况不需要Tokio？ rust主要用于IO密集的应用，对于CPU密 ...

阅读全文 »

Obsidian 使用

发表于 2025-09-27 | 更新于 2025-10-08 | 分类于 tech

基本语法LinkText 使用[LinkText](URL)创建仓库外的链接 ==高亮文本== 使用==内容==来让内容高亮显示删除线内容使用~~删除内容~~来使用删除线 To Do is Done 使用-[ ]创建一个复选框如果把括号中空格换成x，表示勾选 -[x] [[obsidi ...

阅读全文 »

从零构建大模型-LoRA微调

发表于 2025-09-07 | 更新于 2025-10-08 | 分类于 AI

《从零构建大模型》 [美]塞巴斯蒂安·拉施卡书中资料 https://github.com/rasbt/LLMs-from-scratch 附录E 使用LoRA进行参数高效微调LoRA（低秩自适应）是应用最广泛的参数高效微调技术之一。 LoRA简介LoRA是一种通过仅调整模型权重参数的一小部分， ...

阅读全文 »

从零构建大模型-针对分类微调

发表于 2025-09-06 | 更新于 2025-10-08 | 分类于 AI

《从零构建大模型》 [美]塞巴斯蒂安·拉施卡书中资料 https://github.com/rasbt/LLMs-from-scratch 第七章指令微调在开发用于聊天机器人应用程序、个人助理和其他对话任务的大语言模型时，指令微调是主要技术之一指令微调的三阶段：第一阶段准备数据集，第二阶段 ...

阅读全文 »

从零构建大模型-针对分类微调

发表于 2025-09-04 | 更新于 2025-10-08 | 分类于 AI

《从零构建大模型》 [美]塞巴斯蒂安·拉施卡书中资料 https://github.com/rasbt/LLMs-from-scratch 第六章针对分类微调6.1 微调分类微调语言模型最常见的方法是指令微调和分类微调指令微调涉及使用特定的指令数据对一组任务进行训练，以提高语言模型理解和执行 ...

阅读全文 »

从零构建大模型-训练模型

发表于 2025-08-31 | 更新于 2025-10-08 | 分类于 AI

《从零构建大模型》 [美]塞巴斯蒂安·拉施卡书中资料 https://github.com/rasbt/LLMs-from-scratch 第五章训练模型(无标签数据)模型训练过程就是调整模型中的权重参数，大语言模型以及其他深度学习模型的背景下，权重一般指的是学习过程调整的可训练参数。这些权重 ...

阅读全文 »