《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第四章 模型架构4.1 构建一个大语言模型架构 大语言模型,比如GPT(生成式预训练Transformer),是旨在一次生成一个词(或词元)的大型深度神经网 ...
从零构建大模型-注意力机制
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第三章 注意力机制3.1 长序列建模中的问题 Transformer出现之前,循环神经网络(recurrent neural network, RNN)是语言 ...
从零构建大模型读书笔记 1-2
《从零构建大模型》 [美]塞巴斯蒂安·拉施卡 书中资料 https://github.com/rasbt/LLMs-from-scratch 第1章 理解大语言模型 深度学习(deep learning)是机器学习(machine learning)和人工智能(artificial intell ...
Widnows10中WSL使用Ubuntu
Windows10 使用WSL2运行Ubuntu系统配置安装流程 安装WSL,打开系统设置-应用与功能-Windows 功能,勾选其中的Virtual Machine Platform和Windows Subsystem for Linux,重启电脑 到install-manual 下载WSL2 ...
使用rust创建MCP Server
rust创建MCP Server参考文档: https://www.shuttle.dev/blog/2025/07/18/how-to-build-a-stdio-mcp-server-in-rust https://mcpcat.io/guides/building-mcp-server-rus ...
FastAPI简单使用
FastAPI简单使用https://fastapi.tiangolo.com/ 十几年前上学时候用过Flask,了解了python的WSGI,觉得用它开发web服务很方便。最近了解MCP时发现现在很多python应用都在用FastAPI开发,大概了解了一下,FastAPI是基于python新的AS ...
VS Code 工具
VS Code工具Language Server Protocolhttps://microsoft.github.io/language-server-protocol/overviews/lsp/overview/ 代码编辑器中常用的自动补全,转到定义,浮动相关显示文档的功能,每个编辑工具对每种 ...
VS Code通过Cline使用AI
VS Code的Cline插件Cline插件可以直接VS Code插件管理中搜索安装,目前使用效果最好的开源AI助手插件。 配置AI模型Qwen3-Coder 魔搭 https://www.modelscope.cn/ 网站注册账号,这个网站上每天可以免费2000次请求 账号设置中绑定阿里的账号 ...
Google Colab 应用
Google Colab应用Colabhttps://colab.research.google.com/ Colab给每一个笔记一个运行的虚拟Linux环境;每一个代码段或文本段都是一个独立的Cell。 基本使用 目录 当前的根目录为Content目录,可以通过左侧的文件列表来查看 查看当前服务 ...
Cosy Voice 声音克隆
Cosy Voice 声音克隆Cosy Voice V2是阿里开源的声音克隆模型,最少只需3秒原始音频,就可以克隆声音,支持中英文和中国部分地区方言。 Miniconda环境安装Anaconda提供python虚拟环境的功能,与pip不同的是它默认安装了常用的数据科学相关库,所以安装包比较大。除了p ...