avatar
文章
480
标签
104
分类
109
首页
文章
  • 归档
  • 分类
  • 标签
生活
  • 相册
  • 视频
关于
Hongwei Zhao's BlogPrompt Engineering 返回首页
首页
文章
  • 归档
  • 分类
  • 标签
生活
  • 相册
  • 视频
关于

Prompt Engineering

发表于2025-11-16|更新于2026-03-01|大模型微调篇
|浏览量:
文章作者: Hongwei Zhao
文章链接: https://geeks-z.github.io/Blog/2025/11/16/%E5%A4%A7%E6%A8%A1%E5%9E%8B/04.%E5%BE%AE%E8%B0%83%E7%AF%87/03.Prompt%20Engineering/
版权声明: 本博客所有文章除特别声明外,均采用 CC BY-NC-SA 4.0 许可协议。转载请注明来源 Hongwei Zhao's Blog!
大模型微调篇
cover of previous post
上一篇
LLAMA
TODO LLAMA(Large Language Model Meta AI) LLaMA1 文章地址:https://arxiv.org/pdf/2302.13971.pdf项目地址:https://github.com/meta-llama/llama LLaMA2 文章地址:https://arxiv.org/abs/2307.09288项目地址:https://github.com/meta-llama/llama 在AI领域,大模型的发展正以前所未有的速度推进技术的边界。刚刚,Meta在官网上官宣了Llama-3,作为继Llama-1、Llama-2和Code-Lla...
cover of next post
下一篇
常见大模型综述
ChatGLM-6B 清华唐杰老师团队项目: https://github.com/THUDM/ChatGLM-6BBlog: https://chatglm.cn/blog ChatGLM-6B 是一个开源的、支持中英双语的对话语言模型,基于 GLM 架构,具有 62 亿参数。ChatGLM-6B 使用了和 ChatGPT 相似的技术,针对中文问答和对话进行了优化。经过约 1T 个标识符的中英双语训练,辅以监督微调、反馈自助、人类反馈强化学习等技术的加持。为了方便下游开发者针对自己的应用场景定制模型,项目还开源了基于 P-Tuning v2 的高效参数微调代码。 亮点: GLM 是...
相关推荐
cover
2025-11-16
Fine-tuning
cover
2025-11-16
大模型应用优化路径
提示工程、RAG和微调 - 哪个才是大模型应用优化的最佳路径?在上一篇文章 【GitHub Copilot产品经理和微软MVP告诉你:企业是否需要训练自己的代码大模型?- 微软MVP全球峰会纪行】中,我以GitHub Copilot作为案例,和大家分析了企业进行私有化模型训练的6个基本要素。但这其实是一个未完成的话题。 企业内部存在大量的私域数据是客观事实,从代码生成角度来看,私有的框架、公用代码组件、内部编码规范、内部接口定义和说明以及内部业务逻辑这些内容客观存在;即便不适合采用私有化训练的方式,我们也必须找到解决这些问题的有效方式。 在本篇中,我将延续这个话题和大家聊一聊几个大家在大...
cover
2025-11-16
LLM微调
大模型微调的三个节点: 节点 1 ChatGPT:由于 ChatGPT 惊人的效果,让大家意识到 AGI 的可能性,并重视起了大模型+开放指令微调+强化学习这种三阶段范式 节点 2 LLaMA:LLaMA 是 Meta 在今年 2 月份推出的基座模型,宣称 LLaMA-13B 在大多数基准测试中超过了 GPT-3 (175B),而 LLaMA-65B 与最好的模型 Chinchilla70B 和 PaLM-540B 相比非常有竞争力。此外,该项目还开源了 7B、13B、30B 和 65B 版本。 节点 3 Stanford Alpaca:在 LLaMA 的基础上,用 Self-Inst...
cover
2025-11-16
大模型之Adaptation
第7章 大模型之Adaptation 使用语言模型(例如在上下文学习中)通过仅给出提示,我们已经能够执行一些任务。然而,提示方法并不适用于全部的下游任务,如自然语言推理(NLI)、问题回答(QA)、将网络表格转换为文本、解析电子健康记录(EHR)等。 下游任务与语言模型的训练数据(例如,Pile数据集)可能在格式和主题上有所不同,或者需要随时间更新新知识。因此,语言模型需要使用特定于任务的数据或领域知识来针对下游任务进行适配。 7.1 引言7.1.1 为什么需要Adaptation?在自动化和人工智能的时代,语言模型已成为一个迅速发展的领域。这些模型被训练为对各种各样的任务作出响应,但它...
cover
2025-11-16
RAG
cover
2025-11-16
FastApi 部署调用
环境准备本文基础环境如下: 123456----------------ubuntu 22.04python 3.12cuda 12.1pytorch 2.3.0---------------- 本文默认学习者已安装好以上 Pytorch(cuda) 环境,如未安装请自行安装。 首先 pip 换源加速下载并安装依赖包 123456789101112# 升级pippython -m pip install --upgrade pip# 更换 pypi 源加速库的安装pip config set global.index-url https://pypi.tuna.tsinghua.ed...
avatar
Hongwei Zhao
AI Researcher & Developer
文章
480
标签
104
分类
109
Follow Me
公告
欢迎来到我的博客!这里分享 AI、机器学习和数学。
最新文章
智能体
智能体2025-11-16
Scaling Law
Scaling Law2025-11-16
temp
temp2025-11-16
ProximalGradientMethod
ProximalGradientMethod2025-11-16
ES6语法
ES6语法2025-11-16
© 2024 - 2026 By Hongwei Zhao