IT宅
A brief history of the future of AI in education
网络
网络协议
网络编程
存储
Redis
MySQL
架构
重构速查表
架构模式
分布式
Dubbo
消息队列
精进之路
网络
MySQL
Redis
MQ
JVM
所有专栏
专栏推荐
查看更多
架构解码:模式与实践
软件架构与模式
JVM速成手册
JVM相关内容
网络协议
详解网络分层和网络协议工作原理
并发编程
并发编程原理和应用
数据结构与算法
数据结构与算法知识详解
重构速查表
重构的相关技能
MySQL
洞悉MySQL底层架构与SQL调优本质
Redis
洞悉Redis技术内幕:缓存,数据结构,并发,集群与算法
AI
10
Transformer架构:大模型背后的“大脑”
通俗类比:Transformer = 多线程处理语言。解析 Self-Attention,展示图解,避免过于枯燥的数学公式。
大语言模型
注意力机制
计算优化
作者:帅旋
|
发表于 2025-03-07
|
分类于
AI
大模型的进化史:从BERT到DeepSeek R1
在上一篇文章《自然语言处理(NLP)与生成式AI:机器如何“理解”人类语言?》中,我们系统梳理了NLP技术从规则系统到Transformer架构的范式迁移。本文将从技术演进视角,解析大语言模型(LLM)如何通过算法创新与工程突破实现能力跃迁。
大语言模型
注意力机制
计算优化
作者:帅旋
|
发表于 2025-03-01
|
分类于
AI
自然语言处理(NLP)与生成式AI:机器如何“理解”人类语言?
在上一篇文章《AI是什么?从科幻到现实的ChatGPT》中,我们系统梳理了生成式AI的代表性技术——GPT系列模型的演进历程,从ELIZA的规则引擎到GPT-4的多模态突破,揭示了ChatGPT如何通过人类反馈强化学习(RLHF)**和**超大规模预训练实现对话能力的质变。ChatGPT是OpenAI开发的一个大型语言模型,能够生成连贯且符合上下文的文本,广泛应用于对话生成、文本摘要等任务。
GPT
NLP
生成式AI
作者:帅旋
|
发表于 2025-02-23
|
分类于
AI
AI是什么?从科幻到现实的ChatGPT
人工智能(Artificial Intelligence, AI) 是一门研究如何让机器模拟、延伸和扩展人类智能的技术科学。其核心目标是使机器具备感知、推理、学习、决策等能力,甚至能完成创造性任务。
GPT
AI
作者:帅旋
|
发表于 2025-02-22
|
分类于
AI
大模型的局限性:为什么它有时会“胡说八道”?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
大模型的局限性:为什么它有时会“胡说八道”?
待完善
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
多模态AI:ChatGPT何时能看懂图片和视频?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
AutoGPT与自主智能体:AI能否真正自我进化?
讨论 幻觉(Hallucination)、偏见、攻击风险。AI如何自我纠正?DeepSeek R1的优化方法。
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
AI编程助手实战:用ChatGPT开发一个CLI工具
待完善
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
用LangChain快速搭建一个AI应用
待完善
LLM
作者:帅旋
|
发表于 1970-01-01
|
分类于
AI
1
2
×
IT宅
关注公众号及时获取网站内容更新。
请帅旋喝一杯咖啡
咖啡=电量,给帅旋充杯咖啡,他会满电写代码!