大模型如何训练?预训练、微调与提示学习
深入探讨大模型训练的核心技术:从预训练到微调,再到提示学习,全面解析现代AI系统的构建原理与实践方法
作者:帅旋
|
发表于 2025-05-26
|
分类于  AI
大模型如何训练?预训练、微调与提示学习
Transformer架构:大模型背后的“大脑”
通俗类比:Transformer = 多线程处理语言。解析 Self-Attention,展示图解,避免过于枯燥的数学公式。
作者:帅旋
|
发表于 2025-03-07
|
分类于  AI
Transformer架构:大模型背后的“大脑”
大模型的进化史:从BERT到DeepSeek R1
在上一篇文章《自然语言处理(NLP)与生成式AI:机器如何“理解”人类语言?》中,我们系统梳理了NLP技术从规则系统到Transformer架构的范式迁移。本文将从技术演进视角,解析大语言模型(LLM)如何通过算法创新与工程突破实现能力跃迁。
作者:帅旋
|
发表于 2025-03-01
|
分类于  AI
大模型的进化史:从BERT到DeepSeek R1
自然语言处理(NLP)与生成式AI:机器如何“理解”人类语言?
在上一篇文章《AI是什么?从科幻到现实的ChatGPT》中,我们系统梳理了生成式AI的代表性技术——GPT系列模型的演进历程,从ELIZA的规则引擎到GPT-4的多模态突破,揭示了ChatGPT如何通过人类反馈强化学习(RLHF)**和**超大规模预训练实现对话能力的质变。ChatGPT是OpenAI开发的一个大型语言模型,能够生成连贯且符合上下文的文本,广泛应用于对话生成、文本摘要等任务。
作者:帅旋
|
发表于 2025-02-23
|
分类于  AI
自然语言处理(NLP)与生成式AI:机器如何“理解”人类语言?
AI是什么?从科幻到现实的ChatGPT
人工智能(Artificial Intelligence, AI) 是一门研究如何让机器模拟、延伸和扩展人类智能的技术科学。其核心目标是使机器具备感知、推理、学习、决策等能力,甚至能完成创造性任务。
作者:帅旋
|
发表于 2025-02-22
|
分类于  AI
AI是什么?从科幻到现实的ChatGPT
多模态AI:ChatGPT何时能看懂图片和视频?
从单一文本到多模态理解,探索AI如何像人类一样同时处理文字、图片、音频和视频,以及这项技术将如何改变我们的工作和生活。
作者:arthinking
|
发表于 2024-12-20
|
分类于  AI 理论篇
多模态AI:ChatGPT何时能看懂图片和视频?
大模型的局限性:为什么它有时会“胡说八道”?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
作者:帅旋
|
发表于 1970-01-01
|
分类于  AI
大模型的局限性:为什么它有时会“胡说八道”?
AutoGPT与自主智能体:AI能否真正自我进化?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
作者:帅旋
|
发表于 1970-01-01
|
分类于  AI
AutoGPT与自主智能体:AI能否真正自我进化?
大模型的局限性:为什么它有时会"胡说八道"?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
作者:帅旋
|
发表于 1970-01-01
|
分类于  AI
大模型的局限性:为什么它有时会"胡说八道"?
Prompt Engineering实战:让ChatGPT听懂你的需求
待完善
作者:帅旋
|
发表于 1970-01-01
|
分类于  AI
Prompt Engineering实战:让ChatGPT听懂你的需求
123
×
IT宅

关注公众号及时获取网站内容更新。

请帅旋喝一杯咖啡

咖啡=电量,给帅旋充杯咖啡,他会满电写代码!

IT宅

关注公众号及时获取网站内容更新。