• 最后更新 2025-10-27
  • 销量/好评 0条评论
  • 交易规则(重要)

AI大模型算法-从大模型原理剖析到训练(微调)落地实战
本站优惠价
90.00
0.7折 原价:¥1299.00
  • 库存
  • 销量
  • 9999
  • 0

使用时间

永久

下载方式

百度网盘

服务由"itzasfun"发货,并提供售后服务。

    担保交易,安全保证,有问题不解决可申请退款。标价只是源码价格,不包括安装费。购买前请询问清楚卖家,以卖家承诺为准! 自动发货商品,随时可以购买,付款后在订单详情下载,零等待。 不同会员等级尊享不同购买折扣。

微信图片_20251027111741_7_43.jpg

  • 第1章 课程导学与环境介绍 试看7 节 | 164分钟

    本章让学员对课程有初步认知,包括课程的具体安排、学习建议以及所需的硬件资源,无论是个人学习还是公司开发场景皆有涉及。同时,详细阐述在 AI 时代学习大模型和 DeepSeek 理论知识的重要性,针对中国开发者强调重点学习 DeepSeek 的意义。还会讲解大模型常用网站和开源模型下载方法,以及 Linux Anaconda 等开...

    展开列表

  • 第2章 【小试牛刀】DeepSeek认知与体验4 节 | 86分钟

    本课帮助学员建立对 DeepSeek 的全面认识,从理论到实践展开。理论部分将对比分析 DeepSeek 与其他大模型的架构特点和技术演进,重点解析其创新设计; 实战部分基于DeepSeek结合提示工程搭建功能强大的翻译机 、几行代码实现DeepSeek蒸馏模型私有化部署实战 。让大家既能直观理解 Deep Seek 的技术优势,又能掌握基...

    展开列表

  • 第3章 【大模型理论】DeepSeek的诞生之路11 节 | 159分钟

    本章循序渐进地阐释DeepSeek的技术渊源与发展脉络。从NLP基础理论出发,系统梳理从传统方法到现代模型的演进过程,帮助学习者建立完整的认知框架。内容涵盖自然语言处理核心概念、词向量技术原理与实践、预训练模型发展等关键知识点,通过理论解析与实战演练相结合的方式,让学习者深入理解DeepSeek的技术背景和理论基础,...

    展开列表

  • 第4章 【特征编码器Transformer】深入理解大模型的输入输出11 节 | 153分钟

    聚焦于大模型输入输出的核心机制。先讲解大模型的文本切分和 Token 概念,深入探讨 Tokenizer 的作用和影响,包括 BPE 算法的训练和编码过程,并通过手撸代码实战加深理解。接着介绍大模型输入中的位置编码原理和实战,以及输出流程和解码过程,最后通过实战寻找模型最佳的解码参数。...

    展开列表

  • 第5章 【特征编码器Transformer】深入Transfomer中的注意力机制19 节 | 330分钟

    围绕 Transformer 中的注意力机制展开。先进行基础知识准备,然后深入剖析注意力机制的原理,通过手撸 attention 实现代码进行实践。介绍大模型中的残差结构与 FFN,探讨多种注意力机制以平衡效率与性能,并手搓多种注意力机制的实现代码,最后通过手撸 Transformer 实现代码深入理解整个架构。...

    展开列表

  • 第6章 【特征编码器Transformer】深入Transfomer中的位置编码7 节 | 89分钟

    专门探讨 Transformer 中的位置编码。介绍相对位置编码的优势和特点,讲解旋转位置编码 RoPE 的理论基础、核心参数及其影响,探讨其变种形式,分析大模型长文本外延与旋转位置编码的关系,最后通过手撸旋转位置编码 RoPE 代码进行实践。...

    展开列表

  • 第7章 【预训练】大语言模型的预训练13 节 | 132分钟

    介绍大语言模型预训练的相关知识。先阐述大模型的经典训练框架,包括预训练和后训练。接着详细讲解大模型预训练的目标、任务、数据和过程。然后介绍常见的大模型评估测试集以及不同方面的评估方法,如代码、数学、长文等,构建大模型的评估体系,最后通过实战进行大模型代码能力评估...

    展开列表

  • 第8章 【预训练】 预训练的数据工程9 节 | 94分钟

    关注大模型预训练的数据工程。介绍大模型的数据搜集和处理过程,阐述动态训练策略,包括数据配比等。探讨大语言模型面临的合规与工程挑战,最后通过实战介绍大模型预训练海量数据的处理和配比。

    展开列表

  • 第9章 【预训练】 预训练的硬件体系讲解8 节 | 94分钟

    讲解大模型预训练的硬件体系。先介绍大模型训练的算力基础显卡,接着阐述分布式服务器网络架构、硬件 HAL 层、通信硬件抽象 NCCL 以及通信调度框架和拓扑感知通信等内容。

    展开列表

  • 第10章 【预训练】 大模型分布式预训练过程18 节 | 205分钟

    深入介绍大模型分布式预训练的过程。先概述基本过程,然后分别解析数据并行、3D 混合并行、异构并行等不同并行方式的代码。探讨分布式训练的并行与优化策略,介绍万亿参数预训练的软件框架,最后通过实战详细解析千亿 Token 万卡万亿参数预训练代码。...

    展开列表

  • 第11章 【后训练】有监督微调7 节 | 88分钟

    围绕有监督微调展开。先说明预训练与后训练的关系,接着介绍指令理解技术模型微调 SFT,包括其评估方法、数据构造方式,如思维链构造模型逻辑推理能力。还会介绍模型微调的软件框架,最后通过实战利用 Deepseek 思维链数据训练模型的推理能力。...

    展开列表

  • 第12章 【后训练】参数高效督微调4 节 | 36分钟

    介绍参数高效微调技术。先概述参数高效微调的概念,然后分别讲解 Adapter Tuning、Prefix/Prompt Tuning、重参数化(Lora 与 QLoRA)等方法,介绍相关软件框架 PEFT,最后通过实战进行大模型生成公文项目的参数高效微调。

    展开列表

  • 第13章 【后训练】强化学习基础8 节 | 131分钟

    奠定强化学习的基础。介绍马尔可夫决策过程,讲解强化学习的基本概念,如策略、奖励函数、价值函数和 KL 散度等。分别介绍值学习算法和策略梯度算法,最后通过实战进行强化学习算法实践。

    展开列表

  • 第14章 【后训练】人类反馈式强化学习7 节 | 123分钟

    专注于人类反馈式强化学习。先介绍强化学习算法中的奖励模型,接着概述人类反馈式强化学习,深入理解 PPO 算法及其简化版 DPO 算法,最后通过实战详细解析 PPO 算法代码。

    展开列表

  • 第15章 【DeepSeek核心技术解密】国产AI的崛起 DeepSeek核心技术突破7 节 | 105分钟

    介绍国产 AI DeepSeek 的核心技术突破。先分析全球 AI 竞争格局,介绍 DeepSeek 模型的优点与创新。接着详细阐述核心算法架构创新,如 MLA 降低显存占用、GRPO 提升强化学习效率、MOE 优化训练稳定性等。最后介绍训练工程的突破和推理性能的提升...

    展开列表

  • 第16章 【DeepSeek核心技术解密】DeepSeek V3与DeepSeek R18 节 | 134分钟

    聚焦于 DeepSeek V3 和 DeepSeek R1 模型。强调 DeepSeek R1 的逻辑推理能力,从数据和训练两个方面介绍其构建逻辑推理能力的方法。深入理解大模型逻辑推理能力,从应用角度对比两个模型,最后通过多个强化微调实战项目,包括基于蒸馏数据微调、GRPO 算法强化微调等,提升模型性能...

    展开列表

  • 第17章 【企业落地实战】赋能千行百业:大模型落地应用透析4 节 | 67分钟

    探讨大模型在实际应用中的情况。先介绍大模型落地应用所需的核心能力支撑,接着分析大模型落地的现状,从技术验证到价值闭环的转变。介绍典型应用场景和案例,指出大模型落地面临的技术、成本和伦理挑战,最后引发关于大模型时代个人发展的思考...

    展开列表

  • 第18章 【企业落地实战】大模型落地应用核心方法论8 节 | 152分钟

    介绍大模型落地应用的核心方法。讲解提示工程如何解决业务问题,引入 RAG 技术获取实时业务知识,介绍模型微调技术解决业务问题的方法,包括数据构造、训练技巧和评估方法。还会介绍模型量化和高效推理部署方案,以及大模型 Agent 和 MCP 的相关内容,并通过实战进行模型微调训练...

    展开列表

  • 第19章 【企业落地实战】Agent智能政务助手:具备十万字长文档理解10 节 | 152分钟

    以政务服务智能客服项目为例进行企业级实战剖析。先分享大厂算法工程师的 AI 落地经验,接着介绍项目目标、需求分析、数据处理和知识库构建。设计基于 RAG 的政务智能客服方案,包括召回和排序方案,搭建整体链路并进行效果评估和问题分析。还会介绍模型微调方案及效果评估,最后探讨系统升级引入 Function call 和...

    展开列表

  • 第20章 【企业落地实战】生成公文写作系统:具备层次化多级目录万字长公文写作能力持续更新

    围绕大模型生成公文写作产品展开。先进行需求分析,研究知名公文写作产品。接着制定产品方案、数据标注方案、训练方案,进行效果评估和调优

  • 第21章 【展望与前瞻】 多模态与大模型发展趋势持续更新

    介绍大模型未来的发展以及学员的求职指导


  • 商品评价
  • 交易规则


  • 发货方式


  • 自动:在特色服务中标有自动发货的商品,拍下后,源码类 软件类 商品会在订单详情页显示来自卖家的商品下载链接,点卡类 商品会在订单详情直接显示卡号密码。

    手动:未标有自动发货的的商品,付款后,商品卖家会收到平台的手机短信、邮件提醒,卖家会尽快为您发货,如卖家长时间未发货,买家也可通过订单上的QQ或电话主动联系卖家。


  • 退款说明


  • 1、源码类:商品详情(含标题)与实际源码不一致的(例:描述PHP实际为ASP、描述的功能实际缺少、功能不能正常使用等)!有演示站时,与实际源码不一致的(但描述中有"不保证完全一样、可能有少许偏差"类似显著公告的除外);

  • 2、营销推广:未达到卖家描述标准的;

    3、点卡软件所售点卡软件无法使用的;

  • 3、发货:手动发货商品,在卖家未发货前就申请了退款的;

    4、服务:卖家不提供承诺的售后服务的;(双方提前有商定和描述中有显著声明的除外)

    5、其他:如商品或服务有质量方面的硬性常规问题的。未符合详情及卖家承诺的。

  • 注:符合上述任一情况的,均支持退款,但卖家予以积极解决问题则除外。交易中的商品,卖家无法修改描述!


  • 注意事项


  • 1、在付款前,双方在QQ上所商定的内容,也是纠纷评判依据(商定与商品描述冲突时,以商定为准);

    2、源码商品,同时有网站演示与商品详情图片演示,且网站演示与商品详情图片演示不一致的,默认按商品详情图片演示作为纠纷评判依据(卖家有特别声明或有额外商定的除外);

  • 3、点卡软件商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);

  • 4、营销推广商品,默认按商品详情作为纠纷评判依据(特别声明或有商定除外);

    5、在有"正当退款原因和依据"的前提下,写有"一旦售出,概不支持退款"等类似的声明,视为无效声明;

    6、虽然交易产生纠纷的几率很小,卖家也肯定会给买家最完善的服务!但请买卖双方尽量保留如聊天记录这样的重要信息,以防产生纠纷时便于送码网快速介入处理。


  • 送码声明


  • 1、送码网作为第三方中介平台,依据双方交易合同(商品描述、交易前商定的内容)来保障交易的安全及买卖双方的权益;

  • 2、非平台线上交易的项目,出现任何后果均与送码网无关;无论卖家以何理由要求线下交易的(如:要求买家支付宝转账付款的,微信转账付款的等),请联系管理举报,本平台将清退卖家处理。


热门推荐
浏览记录
手机二维码手机访问领取大礼包
返回顶部