人工智能+LLM大模型算法工程师就业培训课程-人工智能学习班-学掌门IT培训

AI内卷，陷僵局？

技术迭代日新月异，AI 赛道竞争白热化，自己的技能却停滞不前，薪资原地踏步，晋升通道被牢牢卡死？

高薪在前，自学无门？

深知AI是未来十年最大风口，LLM算法工程师更是稀缺高薪岗位，却面对Transformer、RLHF、提示工程等复杂技术栈无从下手，自学效率低、效果差，越学越迷茫？

冲刺AI名企，简历零回应

渴望敲开头部科技企业、AI 独角兽的大门，却因缺乏真实项目实战经验、技能体系零散，简历投出去石沉大海，连面试机会都难以获得？

人才市场的 "超级风口"

2025年大模型算法岗需求同比增长215%，人才缺口达12.8万人，预计2027年将扩大至23.5万人，70%AI岗位招聘周期超过3个月，企业 "高薪难觅" 现象普遍。

数据来源：智联招聘《2024 人工智能人才趋势报告》

薪资与职业成长的 "超级加速器"

大模型算法岗平均月薪39,607元，是传统开发岗的2.1倍，应届生起薪(15-30K)已超普通岗3-5年经验水平。"3年晋升T6，5年晋升T7"在头部企业已成常态，晋升速度比传统IT快40%。

抢占 "红利窗口期" 的最佳时机

大模型正从“实验室”走向“规模化应用”，2025年是企业落地元年，此时入门可抢占“早期红利”，成为行业“第一批吃螃蟹的人”；随着技术普及，未来入门门槛可能会提高（企业对技能要求更细分），现在转行能以更低成本积累竞争力。

金融行业

医疗健康行业

教育行业

内容创作与办公行业

生活服务行业

金融行业

风险管控与服务升级双驱动

银行类APP

招商银行
工商银行

证券类APP

东方财富 APP

医疗健康行业

从辅助诊断到健康管理

问诊咨询类APP

春雨医生APP
京东健康 APP

科研辅助类APP

PubMed AI

教育行业

个性化学习与效率提升

K12教育类APP

猿辅导APP
作业帮APP

内容创作与办公行业

生产力工具革新

内容创作类APP

剪映APP
WPS AI

代码开发类APP

GitHub
Copilot X

生活服务行业

交互体验全面升级

出行旅游类APP

携程APP

电商购物类APP

淘宝APP

应届生小白

有自己的职业规划，且具有职业前瞻性，目标抢占AI赛道先机的学生群体。

计算机、数学、统计等相关专业学习效果更佳

零基础转行

零经验，但对人工智能或者大模型算法感兴趣，很看好相关行业发展。

希望借助技术风口实现职业[弯道超车]，走向职业逆袭之路

技术转型者

有基础编程能力的职场人(Java/前端/测试等)、对AI有热情的产品经理/运营、传统行业技术爱好者。

期待成功转型后，薪资能够得到提升和翻倍。

AI行业从业人员

想要深耕行业，用AI重构业务能力的垂直领域，从[业务执行者]转向 [AI赋能者]

在职业发展上实现薪资翻倍、晋升加速

01.扎实的AI算法理论基础

深刻理解机器学习、深度学习、大模型的核心算法原理
掌握从传统ML到Transformer架构的技术演进逻辑
具备解决复杂AI问题的理论分析与建模能力

02.全栈的工程实现能力

熟练使用PyTorch/TensorFlow等主流深度学习框架
掌握从数据处理到模型训练、优化、部署的完整工程链路
具备千亿参数大模型的分布式训练与推理加速能力

03.企业级的应用开发能力

能够基于LangChain/LlamaIndex构建生产级AI应用
掌握RAG知识库、Agent智能体、多模态应用等前沿技术
具备将大模型技术与业务场景深度融合的产品化能力

04.高端的性能优化能力

掌握GPU底层CUDA编程与算子优化技术
熟练使用模型量化、TensorRT、vLLM等推理加速技术
具备构建高并发、低延迟AI服务的系统架构能力

技术广度全覆盖，打通AI全栈技术链

系统构建从算法到工程的完整AI技术体系，避免碎片化学习

从传统机器学习到深度学习框架，再到Transformer大模型、LangChain应用开发、RAG检索增强、Agent智能体、多模态AI，直至模型量化部署与推理优化。

技术深度层层递进，从API到工业级优化

每一层技术都深入底层原理与工程实现，培养真正的工业级开发能力

从API调用到算法原理，从单机训练到分布式并行，从基础微调到RLHF人类反馈强化学习，从模型压缩到INT4量化(显存降低75%)，从TensorRT加速到Triton高并发服务(520 QPS)。

一线大厂导师领衔，真实项目经验传授

理论讲解深入浅出，大厂踩坑经验倾囊相授

课程主力讲师均来自美团、百度、星环等顶尖科技公司，平均从业经验10年以上。主导过亿级用户AI系统、千亿参数大模型项目

20+企业级实战项目，对标1-3年工作经验

70B大模型量化部署、Triton高并发服务、端云协同架构等真实生产级项目，可直接写入简历作为工作经验

覆盖大模型训练微调、企业级RAG系统、Agent智能体、计算机视觉、NLP、多模态应用等方向

掌握LangChain+RAG+Agent核心应用技术

这些技术直接对应企业最迫切需求，学完即可落地

深度讲解99%企业AI应用的核心技术栈：LangChain开发框架、企业级RAG系统(多路召回、 Rerank重排序、GraphRAG)、Agent智能体开发、向量数据库应用。

量化部署与推理优化，掌握降本增效核心技能

这些稀缺技能是企业降本增效的关键，也是高薪岗位的核心竞争力。

系统学习GPTQ/AWQ量化技术(显存降低70%)、TensorRT推理加速(提升10倍)、vLLM分布式推理、Triton高并发部署、端云协同架构(成本降低60%)。

多模态前沿技术，抢占AI技术制高点

掌握多模态能力，在技术浪潮中始终保持竞争优势。

深入学习视觉-语言模型(LLaVA、Qwen-VL、GPT-4V)、AI绘画(Stable Diffusion)、语音处理 (Whisper)、多模态RAG等下一代AI应用核心技术。

工信部认证考证+就业保障，全方位职业护航

免费赠送《AIGC大模型应用开发工程师(高级)》工信部认证考证辅导

配套提供简历优化、面试技巧、100+份大厂面试真题、企业内推、闯关式学习督导等全方位就业服务，确保学习效果与就业竞争力。

云帆老师

核心背景

16+年大数据与AI实战经验，国内早期一批数据挖掘应用落地导师
曾任华院数据研发总监及董事，主导商业智能与数据挖掘业务线
联合创立杭州数云信息技术有限公司（CTO），获红杉资本+阿里巴巴双轮投资
2002年即投身数据挖掘领域，见证并推动中国大数据产业从0到1的发展历程

技术实力

深度掌握机器学习、深度学习、数据挖掘全栈技术体系
精通SAS、Python、Hadoop等主流大数据技术栈，具备企业级架构设计能力
擅长商业智能(BI)、精准营销、客户关系管理(CRM)等业务场景的算法建模与落地
具备从0到1构建数据产品的完整经验，覆盖算法研发、工程实现、商业化落地全链路
精通电商数据分析与智能决策，深谙零售、金融等行业数据应用痛点

天行老师

核心背景

17+年技术实战经验，横跨高校教学、算法研发、工程部署全链路
曾任星环信息科技算法工程师，主导多个银行客户大模型项目及AI平台建设
曾任某上市教育机构人工智能算法讲师，深度参与AI课程研发与教学体系构建
拥有8年高校教学经验（南昌工学院），深谙教育规律与知识传递方法
从教育到工业界的成功转型者，融合理论深度与工程实战的双重视角

技术实力

GPU底层优化导师：精通CUDA编程、GEMM优化、TensorCore编程，对SASS汇编优化有深入理解
深度掌握Cutlass、CUTE、cuBLAS等开源算子加速库，具备超越官方库的性能调优能力
精通TensorRT、NVIDIA Triton、vLLM等模型部署推理加速技术栈
熟悉大语言模型量化部署、分布式训练、向量数据库及LangChain开发
掌握OpenAI Triton、LLVM、TVM等AI编译器技术熟练运用Python、C++、Hadoop、Docker、K8s等全栈技术
具备3-5人团队管理经验，擅长技术攻坚与项目落地

星河老师

核心背景

7+年一线互联网AI实战经验，历经传统机器学习到大模型全技术周期
现任美团履约平台AIGC组大模型算法工程师，主导多模态理解、对话生成等核心项目
曾任百度大商业高级算法工程师，负责搜索系统优化与内容生成，带领3人技术团队
曾任顺丰科技机器学习工程师，深耕供应链预测与智能定价场景
18篇发明专利主导撰写，覆盖搜索、推荐、NLP等多个技术领域

技术实力

多模态大模型导师：精通LLava、Qwen-VL等视觉语言模型的微调与优化，擅长图文理解、对话生成场景落地
搜索推荐全栈能力：深度掌握Query理解、召回排序、相关性优化、流量反作弊等搜索核心技术
NLP算法导师：精通BERT、ERNIE等预训练模型，擅长文本分类、序列标注、意图识别、内容生成
图神经网络实战：熟练运用GraphSage、文本图等技术，实现用户-商品关系建模与向量召回
RAG系统构建：具备从知识库建设、向量化、相关性过滤到内容生成的完整RAG落地经验熟练掌握Python、C++、Hadoop、Spark、SQL等全栈技术，熟悉Linux开发环境

Leo老师

核心背景

10+年AI算法与工程经验，6年AI团队管理经验
曾任头部金融科技公司AI团队负责人，负责算法+工程双线
曾任国内顶尖芯片企业核心算法工程师
曾任头部互联网公司算法导师

技术实力

主导构建企业级多模态RAG平台，服务亿级用户的智能客服、语音助手等产品
深度掌握DeepSeek/Llama/Qwen等主流模型的训练、优化、部署全链路技术
精通轻量级LLM定制优化、多模态融合算法、量化加速部署、端云协同架构
理解GPU/NPU硬件架构，具备CUDA编程和性能优化实战能力
熟悉Android/Linux等多平台底层开发与算法部署

传统人工智能算法阶段

大模型算法阶段

大模型部署与训练阶段

大模型开发阶段

本阶段系统深入地学习人工智能四大核心领域——机器学习、深度学习、自然语言处理（NLP）与知识图谱，全面覆盖从基础理论、主流算法、开发框架（Scikit-learn / PyTorch / TensorFlow / 客服等真实行业案例，培养学员的数据建模、特征工程、模型训练、调优部署及跨模态任务解决能力，为AI工程化落地打下坚实基础。

完成本阶段学习后，学员将具备扎实的算法基础与工程实践能力，能够胜任：

机器学习工程师
深度学习算法工程师
计算机视觉（CV）工程师
自然语言处理（NLP）工程师
AI应用开发工程师

课程一、机器学习算法(必修)

课程简介

学习分类、聚类、回归、协同过滤等经典机器学习算法,掌握Scikit-learn框架

核心知识点

数据预处理、特征工程、特征降维(PCA/LDA)
分类算法:KNN、决策树、朴素贝叶斯、逻辑回归、SVM
聚类算法:K-means、层次聚类、DBSCAN
协同过滤推荐算法
集成学习:随机森林、GBDT、XGBoost、LightGBM

阶段项目

泰坦尼克号获救预测(分类)
购物车推荐系统(协同过滤)
客户价值分析(聚类)
电商评论情感分析(NLP+分类)
图像分类识别系统(OpenCV+随机森林)

课程二、深度学习框架(必修)

课程简介

学习神经网络、CNN、RNN等深度学习算法,掌握PyTorch和TensorFlow框架

核心知识点

神经网络基础:BP算法、激活函数、损失函数、优化器
CNN卷积神经网络:卷积层、池化层、经典网络架构
RNN循环神经网络:LSTM、GRU、Seq2Seq
PyTorch框架:Tensor、Autograd、nn.Module、DataLoader
TensorFlow框架:计算图、Keras API、TensorBoard

阶段项目(PyTorch)

智能垃圾分类(CNN图像分类)
酒店评论情感分析(BiLSTM文本分类)
智能机器翻译(Seq2Seq+Attention)

阶段项目(TensorFlow)

新闻文本分类(TextCNN/LSTM)

课程三、NLP自然语言处理(必修)

课程简介

学习NLP核心技术,包括分词、词向量、文本分类、序列标注等

核心知识点

中文分词、TF-IDF、Word2Vec词向量
文本分类、序列标注(NER命名实体识别)
BiLSTM+CRF模型、文本相似度计算

阶段项目

国家电网投诉分类系统(Word2Vec+LR、TextRCNN)
医疗命名实体识别(BiLSTM+CRF、构建糖尿病知识图谱)

课程四、知识图谱(必修)

课程简介

学习知识图谱构建技术,包括实体识别、关系抽取、图数据库等

核心知识点

Neo4j图数据库、Cypher查询语言
命名实体识别(NER)、关系抽取
知识推理、语义搜索、智能问答

阶段项目

武器知识图谱(Neo4j)

课程五、企业AI场景应用(必修)

课程简介

5个真实企业场景的完整AI项目

阶段项目

零售精准营销预测系统(RFM模型)
电影推荐系统(SVD协同过滤)
文档自动分类系统(NLP+Word2Vec)
银行投诉分类系统(LSTM)
智能客服机器人(知识图谱+对话系统)

课程六、Transformer架构(必修)

课程简介

学习大模型的基础架构Transformer,为后续LLM学习铺路

核心知识点

Attention注意力机制、Self-Attention、Multi-Head Attention
Transformer完整架构:Encoder-Decoder、Position Encoding
Transformer在NLP任务中的应用:文本分类、序列标注、文本相似度、摘要生成、对话系统

阶段选修内容

选修、计算机视觉(CV)

核心知识点： OpenCV图像处理、目标检测(YOLO)、实例分割(MaskRCNN)、人脸检测识别

项目:

YOLOv3人脸检测
CT肺结节检测
人脸识别平台

选修、其他算法

半监督学习、迁移学习、强化学习入门
语音识别(GMM-HMM、LSTM+CTC)
大数据+AI部署(Spark MLlib、TensorFlow Serving、TorchServe)

选修、深度学习与视觉领域的实践应用

课程简介: 系统掌握图像处理基础与深度学习在计算机视觉中的三大核心任务（图像分类、目标检测、图像分割）的原理与实战应用

核心知识点:

OpenCV图像预处理：剪裁、增强、特征提取
基于传统机器学习的图像分类（KNN、随机森林）
图像分类、目标检测、实例分割的深度学习原理与PyTorch/TensorFlow实现
YOLOv3、Mask R-CNN、RetinaFace+FaceNet等主流CV模型架构与训练
医学影像处理（DICOM、SimpleITK）与智慧医疗场景应用

选修、YOLOv11深度实战

课程简介: 深入学习YOLO目标检测算法,掌握从原理到部署的完整技能

核心知识点:

源码解析、模型训练、超参数调优
工业部署:PyTorch→ONNX→TensorRT、CUDA加速、Triton Server
YOLO系列演进史、YOLOv11核心技术(C3K2、PANet++、TaskAlignedAssigner)

阶段项目一、YOLOv3人脸检测系统（Wider Face数据集）（选修）

基于YOLOv3目标检测算法，在Wider Face数据集上训练并实现高精度的人脸检测系统。

阶段项目二、TensorFlow 2.X实现Mask R-CNN实例分割（选修）

使用TensorFlow 2.X从零搭建Mask R-CNN模型，实现对图像中多个对象的像素级实例分割。

阶段项目三、基于CT影像的肺结节自动检测（智慧医疗）（选修）

结合医学影像处理与深度学习技术，构建可辅助医生初筛肺结节的AI检测系统，提升阅片效率与准确性。

阶段项目四、OpenCV+随机森林图像分类系统（生活场景）（选修）

利用OpenCV提取图像特征并结合随机森林分类器，实现轻量级、可解释性强的图像分类应用。

阶段项目五、RetinaFace+FaceNet人脸识别平台（智能小区）（选修）

集成RetinaFace人脸检测与FaceNet特征嵌入，构建端到端的人脸识别平台，适用于门禁、安防等智能社区场景。

选修、语音识别技术原理与算法实现

课程简介: 系统掌握语音识别核心算法，从传统GMM-HMM模型到现代深度学习方法，构建完整理论与实践基础

核心知识点:

马尔可夫链与S序列建模基础
GMM-HMM混合模型原理及其在语音识别中的应用
语音识别基本流程与核心算法框架
基于LSTM的序列建模与文本分类实战

本阶段聚焦大语言模型（LLM）核心技术体系，系统讲授从底层架构（Transformer）、训练机制（预训练/微调/强化学习）到工程优化（量化、加速、推理部署）的全栈能力。课程覆盖GPT、 LLaMA、Qwen、DeepSeek等主流大模型架构，深入解析Prompt工程、参数高效微调（PEFT）、模型量化、分布式训练、推理加速等工业级关键技术，并结合Qwen微调、RAG系统、智能对话等实战项目，帮助学员掌握大模型从理论到落地的完整闭环。

完成本阶段学习后，学员将具备扎实的大模型算法研发与工程优化能力，能够胜任：

大模型算法工程师
LLM训练与微调工程师
大模型推理优化工程师
AIGC应用开发工程师
生成式AI系统架构师

课程七、大模型核心技术(必修)

课程简介

学习大模型的核心算法原理,理解ChatGPT等模型的工作机制

核心知识点

大模型发展史:BERT→GPT→ChatGPT
Transformer深度剖析
分词算法:BPE、WordPiece、SentencePiece
位置编码:绝对/相对/旋转位置编码(RoPE)
解码策略:贪心、Beam Search、Top-k/Top-p采样
Finetune微调理论、RLHF强化学习原理

课程八、大模型优化与微调(必修)

课程简介

学习大模型的工程优化和微调技术,掌握实际项目落地能力

核心知识点

Prompt工程: Prompt设计、Few-Shot、思维链(CoT)
PEFT参数高效微调: LoRA、QLoRA、Prefix-Tuning、P-Tuning、Adapter
模型量化: INT8/INT4/FP16、PTQ、QAT、GPTQ、AWQ
模型评测: Perplexity、BLEU、ROUGE、MMLU、C-Eval、HumanEval
性能加速: KV-Cache、Flash Attention

阶段项目

Qwen大模型微调实战: 使用Swift框架完成SFT、RLHF、DPO、GRPO等多种微调方法

课程九、主流大模型架构(必修)

课程简介

学习GPT、LLaMA、Qwen、DeepSeek等主流大模型,掌握模型选型能力

核心知识点

GPT系列:GPT-3.5、GPT-4
LLaMA系列:LLaMA、LLaMA2、LLaMA3
Qwen系列:通义千问
DeepSeek系列:DeepSeek-V2/V3、DeepSeek-R1
ChatGLM系列、Claude、百川、文心一言
领域专用大模型:医疗、金融、法律、代码大模型
企业模型选择策略:性能、成本、场景适配

阶段选修内容

番外篇、大模型算法工程实战、头部大厂算法专家完整技术分享(Leo老师-大厂专家)

课程简介: 头部大厂AI团队负责人分享10+年实战经验,深度解密DeepSeek等前沿技术

核心知识点:

GPU架构与CUDA编程、GEMM矩阵优化
LLM完整训练流程:PreTraining、SFT、RLHF
分布式训练:数据并行、模型并行、流水线并行
推理加速:量化、轻量级LLM、端云协同
DeepSeek技术解密:MLA、MoE、GRPO、FP8训练
多模态:CLIP、BLIP、Qwen-VL

阶段项目:

企业级RAG平台(端云协同、降本60%)
智能对话助手

本阶段聚焦大模型落地的核心环节——高性能推理部署与训练优化，系统讲授工业级模型服务化全流程。课程深入解析 vLLM、TensorRT-LLM、llama.cpp 等主流推理引擎的核心机制（如 PagedAttention、Continuous Batching、INT4/INT8 量化），涵盖高并发 API 构建、显存与吞吐优化、分布式推理、容器化部署（Docker/K8s）及 Triton/Ray Serve 等生产级服务框架。同时，通过选修模块延伸至分布式训练（FSDP/ZeRO）、混合精度训练（FP8/BF16）和底层 GPU 编程（CUDA、Tensor Core），打通“训练-优化-部署”全链路能力。

完成本阶段学习后，学员将具备大模型在真实业务场景中的工程落地能力，能够胜任：

大模型推理部署工程师
模型优化与性能调优专家
AI基础设施工程师
LLM服务架构师
GPU加速与系统优化工程师

大模型推理部署与加速(必修)

课程简介

学习vLLM、TensorRT-LLM等推理框架,掌握模型服务化和性能优化

核心知识点

推理框架: vLLM(PagedAttention、Continuous Batching)、TensorRT-LLM(量化INT8/INT4)、llama.cpp
模型服务化: FastAPI服务构建、负载均衡、流式输出、并发控制、Docker/K8s部署
性能优化: KV-Cache复用、投机解码、批处理优化、显存优化
分布式推理: 张量并行、流水线并行、Ray Serve、Triton Inference Server

阶段选修内容

选修、大模型训练优化

核心知识点: 分布式训练(DDP/FSDP/ZeRO)、混合精度(FP16/BF16/FP8)、Flash Attention、梯度累积

选修、GPU编程与优化

核心知识点: CUDA编程基础、Kernel优化、共享内存、Tensor Core、自定义算子

阶段项目

vLLM高并发推理服务: 构建生产级API服务
TensorRT-LLM加速: INT8/INT4量化、多GPU推理
企业级模型服务平台: 多模型路由、监控、容器化部署

本阶段聚焦大模型在前沿应用层的落地实践，系统学习 RAG（检索增强生成）、AI Agent（智能体）和多模态大模型三大核心技术方向。课程覆盖从知识库构建、向量检索、智能体规划决策，到图文跨模态理解与生成的完整开发链路，深入讲解 BGE/M3E 嵌入模型、Faiss/Milvus向量数据库、LangChain/LangGraph 智能体框架、CLIP/LLaVA/Qwen-VL 等主流多模态架构，并结合电商、医疗、金融、内容安全等真实场景，打造可落地的 RAG问答系统、自主决策 Agent 和多模态AI 应用。同时，通过 LangChain 多智能体协作、YOLOv11 视觉融合等选修内容，进一步拓展工程边界，培养“算法+系统+产品”三位一体的高阶AI 开发能力。

完成本阶段学习后，学员将具备构建下一代生成式 AI 应用的核心能力，能够胜任：

RAG 架构师
AI Agent 工程师
多模态 AI 工程师
智能对话系统开发工程师
AIGC 应用研发工程师

课程十、RAG检索增强生成(必修)

课程简介

学习RAG系统完整开发流程,构建企业级智能问答系统

核心知识点

知识库构建: 文档解析、文本分块、知识图谱、向量化
向量检索: Embedding模型(BGE/M3E)、向量数据库(Faiss/Milvus/Chroma)、混合检索
检索优化: 意图识别、相关性过滤、重排序(Rerank)
Prompt工程: RAG场景Prompt设计、上下文管理、查询改写
集成学习:随机森林、GBDT、XGBoost、LightGBM
生成优化: LLM集成、流式输出、质量控制
评估监控: 准确率/召回率、A/B测试

阶段项目

智能文档管理系统: 多模态输入(图文)、多路召回、RoBERTa+Faiss、Wiki知识融合
医疗问答系统(知识图谱+RAG): Neo4j图数据库、向量检索+图谱查询、医学知识推理
汽车知识问答系统: 汽车垂直领域、车型识别、故障诊断、多模态输入

课程十一、AI Agent智能体(必修)

课程简介

学习AI Agent开发技术,构建具备自主决策能力的智能体系统

核心知识点

Agent理论: ReAct范式、思维链(CoT)、自我反思、任务规划
工具使用: Function Calling、API调用、工具选择、错误处理
Agent框架: LangChain Agent、AutoGPT、MetaGPT、LangGraph工作流
记忆系统: 短期记忆(对话历史)、长期记忆(向量库)、个性化管理
多Agent协作: 通信机制、任务分解、协作策略

阶段项目

零代码Agent开发(Coze平台): 可视化工作流、知识库、插件集成、多渠道发布
智能投资助手: 记忆系统、工具集成(行情API/财报)、规划能力、风险控制

课程十二、多模态基础技术(必修)

课程简介

学习视觉-语言融合的多模态AI技术基础

核心知识点

视觉编码器: ViT(Vision Transformer)、CLIP视觉编码器
跨模态对齐: CLIP对比学习、图文检索
多模态融合: BLIP/BLIP-2、Flamingo
图像生成: Stable Diffusion、FLUX、ControlNet、文生图/图生图

课程十三、多模态大模型应用(必修)

课程简介

学习主流多模态大模型,开发图文理解、生成等应用

核心知识点

主流多模态大模型: DeepSeek-VL、LLaVA、InternVL、GLM-VL、Qwen-VL、Qwen-omini
模型评测: MMBench、MMMU评测基准
部署优化: 模型量化、推理加速
模型训练: 视觉-语言对齐、指令微调
文生图实践: Stable Diffusion、LoRA微调

阶段项目

电商多模态商品检索: CLIP跨模态检索、以图搜图、语音搜索
地理位置识别系统: 地标识别、地理编码、地理知识图谱
用户意图理解系统: 融合文本/图像/语音、意图分类、情感分析
内容安全审核平台: 图像/文本/视频/音频审核、YOLO检测、OCR识别
视频情感分析系统: 表情识别、语音情感、文本情感、时序建模

阶段选修内容

选修、LangChain多智能体协作开发

课程简介: 系统学习LangChain框架,从基础到多智能体协作的完整开发

核心知识点:

LlamaIndex RAG开发、Text2SQL
LangChain核心组件:Models、Prompts、Chains、Memory、Tools、Agent
LCEL表达式语言、Retrieval检索增强
LangGraph工作流编排、MCP协议

阶段项目:

多智能体协作诊断系统(LangGraph)

选修、YOLO v11深度实战：算法原理、源码解析与工业部署（重磅升级）

课程简介: 深入学习YOLO目标检测算法,掌握从原理到部署的完整技能

核心知识点:

YOLO系列演进史、YOLOv11核心技术(C3K2、PANet++、TaskAlignedAssigner)
源码解析、模型训练、超参数调优
工业部署:PyTorch→ONNX→TensorRT、CUDA加速、Triton Server

其他选修课

机器学习数理基础(数理统计、高等数学)
半监督学习、迁移学习、强化学习入门
大数据+AI分布式部署(Spark MLlib、模型部署)

PyTorch深度学习框架实战：
携程酒店评论情感分析智能系统

项目简介

在线下消费时,大家已经习惯了在美团、口碑、携程等网站上查看该商户的评价，以确定自己是否在这家店进行消费。每一家商户在这些APP上都有大量的评论信息，有的是正面的评论信息，有的是负面的评论信息。一款智能的APP能自动的对用户的评价进行分类。本项目使用携程app酒店评论数据，搭建BiLSTM模型训练情感分析模型，并使用flask框架部署微服务。

项目目标

通过本次项目实训，希望学员能够掌握如何通过pytorch训练情感分析模型，内容包括但不限于：

文本预处理方法
torchtext文本数据集构造方法
使用pytorch搭建BiLstm情感分析模型
完成模型训练、验证和评估
使用flask进行模型微服务部署

PyTorch深度学习框架实战：
基于seq2seq模型实现的智能机器翻译平台

项目简介

本项目将带领同学们使用一份小规模的英汉平行语料，使用基于注意力机制的seq2seq模型搭建一个机器翻译模型并完成训练和预测。由于机器翻译模型极度依赖于规模大、高质量的平行预料以及大规模计算力，因此，本次实验得到的机器翻译模型仅能够证明机器翻译的可行性，翻译效果并不能达到理想水平。

项目目标

通过本次实验，希望学员能够掌握基于attention机制的seq2seq模型在机器翻译中的应用，内容包括但不于：

基于rnn搭建encoder编码器
搭建concat形式的注意力机制模块Attn
基于rnn搭建decoder解码器
搭建基于注意力机制的seq2seq模型结构
seq2seq模型的训练和评估

项目实战：
使用tensoflow搭建TextCNN、
Lstm的新闻文本分类模型

项目简介

当今处在互联网高度发展时期,各种信息以狂轰乱炸的形式扑面而来,而信息的载体大部分是文字的形式,如何从海量文本中获取有用的信息成为现代科技工作者研究的一个大的方向,也是自然语言处理领域研究的关键问题,本次项目使用THUCNews数据集，通过tensorflow框架搭建文本分类模型，完成新闻分类任务。

项目目标

通过本次项目实训，希望学员能够掌握如何通过tensorflow训练文本分类模型，内容包括但不限于：

文本预处理方法
文本数据集构造方法
使用tensoflow搭建TextCNN、Lstm等文本分类模型
完成模型训练和验证
使用tensorboard监控模型训练
加载模型实现推理预测

NLP项目实训: 医疗命名实体识别
（BiLstm+Crf模型，构建糖尿病知识图谱）

项目简介

本次项目旨在通过糖尿病相关的教科书、研究论文来做糖尿病文献挖掘并构建糖尿病知识图谱，我们需要使用已经标注的医学语料，同构搭建BiLstm+Crf进行训练，最终实现使用算法来提取医疗领域的各种实体，从而为进一步提取实体关系构建知识图谱打好基础。

项目目标

通过本次实验，希望学员能够掌握基于BiLstm+Crf模型在命名实体识别中的应用，内容包括但不限于：

掌握序列标注任务的文本预处理方法
了解命名实体识别中的IOB标注
掌握BiLstm+Crf模型的搭建方法
掌握BiLstm+Crf模型的训练和评估
使用训练的模型进行命名实体识别预测

项目实战：
基于NLP自然语言构建的文档自动分类系统
（门户网站+情感分析）

项目背景

文本分类是时下人工智能应用热点，其被广泛应用如下场景：

垃圾邮件的判定
类别：垃圾邮件、非垃圾邮件
新闻频道分类(本课程案例)
类别：经济、体育、娱乐、政治
词性标注
类别：动词、名词、形容词
情感识别
类别：正向评论、负向评论

核心技术

对文档进行分词
用TFIDF和词袋表示文档特征
用word2vec词向量表示文档特征
训练文档分类模型
模型效果评估
对新文档进行分类预测

项目实战：
电商多模态商品检索平台

项目简介

1. 构建支持文本、图像、语音多模态输入的智能商品检索系统，用户可通过拍照、语音描述或文字搜索商品
2. 集成CLIP多模态对齐模型实现图文跨模态检索，用户上传商品图片即可找到相似商品或同款商品
3. 使用ViT视觉编码器提取商品图像特征，结合文本Embedding构建统一的多模态向量空间
4. 支持属性筛选和多条件组合检索，如"红色连衣裙优雅风格 500元以内"等复杂查询场景

涉及技术

多模态检索模型：CLIP实现图文跨模态对齐，支持以文搜图、以图搜图、图文联合检索
视觉特征提取：ViT或ResNet提取商品图像特征，识别颜色、款式、材质等视觉属性
向量检索引擎：Faiss或Milvus实现亿级商品的毫秒级相似度检索
多模态融合技术：将文本、图像、属性等多维特征融合，提升检索准确率
语音识别ASR：集成语音转文本技术，支持语音购物场景