第八章：数据持久化与数据库

序言

界面搭建得有模有样了，但你发现一个尴尬的问题：每次刷新网页，刚才填写的表单、生成的对话全都不见了。

老师傅告诉你，这是因为浏览器里的数据默认只存储在临时的内存中。想要数据在关闭或刷新页面后依然存在，你需要数据持久化。

他严肃地提醒你：数据是所有业务的基石。前端代码丢了可以重写，UI 丑了可以换皮，但如果数据库里的用户数据丢了、乱了，你的产品就彻底完了。这就是为什么后端开发往往比前端更注重严谨性——因为你守护的是产品的灵魂。

JSON 文件存储

持久化不一定上来就要装复杂的软件。最简单的方式，其实就是把你之前在配置文件里学到的 JSON 格式利用起来，把数据存成 .json 文件。每一条聊天记录或用户信息，本质上就是一段文本。把它保存进硬盘的文件里，下次读取文件就能恢复。这种方式让你瞬间理解了“数据库”的本质——无非就是高效地读写硬盘上的文件。

关系型数据库

虽然 JSON 文件简单，但当你数据多了，想找"所有住在北京且年龄大于 20 岁的用户"时，就需要遍历整个文件，效率极低。于是你接触到了 Relational Databases（关系型数据库）。老师傅让你把它想象成一个超级 Excel，理解它只需要掌握几个关键点：

Table (表)：就是一个 Excel Sheet（工作表），比如 Users 表。
Row (行)：表里的一行，代表一条具体的数据（比如用户张三）。
Column (列)：表里的表头，定义了数据有哪些属性（姓名、年龄、邮箱）。
Primary Key (主键)：每一行数据的唯一身份证号（通常是 id），绝对不能重复。
Foreign Key (外键)：用来关联其他表的线索。比如在 Orders（订单）表中记录一个 user_id，就能顺藤摸瓜找到这个订单属于哪个用户。

如何判断 AI 设计的表结构好坏？ 新手往往很难一眼看出 Schema 设计得合不合理。老师傅传授了你一招**“AI 交叉论证法”**（俗称“炼蛊”）：你让 AI 1号 帮你设计好表结构，然后把生成的代码发给 AI 2号 或 AI 3号 ，问它：“作为一个资深数据库架构师，根据我的PED和实际业务场景，这个设计是合理的设计吗，有什么潜在的性能隐患或逻辑漏洞？” 通常经过两轮这样的“左右互搏”，你就能得到一个非常健壮的数据库模型。

Drizzle Schema

操作数据库的标准语言是 SQL，在本教程中使用 Drizzle ORM。Drizzle 使用 TypeScript 定义 Schema，AI 会根据 PRD 文档自动生成。

比如 PRD 中写明"一个用户可以发布多篇文章"，AI 会自动在 User 表添加 posts 字段，在 Post 表添加 authorId 外键。你的工作是审查 AI 生成的代码是否正确。

老师傅说："数据库设计的关键是理解业务关系。AI 能处理技术实现，但'用户和订单是什么关系'需要你理解业务。"

为了能看懂 AI 交的作业，老师傅指着一段代码，逐行教你理解：

typescript

// src/db/schema.ts
import { pgTable, serial, text, timestamp, integer } from 'drizzle-orm/pg-core'

export const users = pgTable('users', {
  id: serial('id').primaryKey(),           // 自增主键
  email: text('email').notNull().unique(),  // 必填且唯一
  name: text('name'),                       // 可选字段（不加 .notNull()）
  createdAt: timestamp('created_at').defaultNow(),
})

// 关联表示例
export const posts = pgTable('posts', {
  id: serial('id').primaryKey(),
  title: text('title').notNull(),
  authorId: integer('author_id').references(() => users.id), // 外键关联
})

pgTable：定义 PostgreSQL 表结构
类型：serial（自增整数）、text（文本）、boolean（布尔）、timestamp（时间）、integer（整数）
可选字段：不加 .notNull() 的字段默认可选
.unique()：字段值唯一
.references()：定义表之间的外键关联

数据库操作

掌握数据库操作，你只需要理解三个核心概念。

CRUD 操作：虽然不用写 SQL，但你必须把 CRUD（Create 增、Read 查、Update 改、Delete 删）刻在脑子里。这是所有数据库操作的基石，也是你指挥 AI 操作数据的核心通用术语。

事务——保证数据完整性：老师傅补充了一个关键概念："有些操作涉及多个数据库改动，必须'打包'执行。比如转账——从 A 账户扣钱、给 B 账户加钱。如果扣钱成功了但加钱失败，数据就乱了。" 事务（Transaction） 就是把多个操作打包成"要么全成功、要么全失败"的原子操作。这在处理金融、订单等关键业务时必不可少。

索引——加速查询：老师傅补充："你可能会遇到一个问题——数据多了以后，查询越来越慢。比如在百万用户中查找某个 email，没有索引的话，数据库要一行行扫描。" 索引（Index） 就像书本的目录。没有索引，数据库要全表扫描；有了索引，直接定位到目标位置，速度快几十倍。但索引不是越多越好。它占用额外空间，而且增删数据时要更新索引，反而影响写入性能。所以通常只在"经常查询的字段"上建索引，比如 email、created_at。

AI 知道什么时候需要使用事务、哪些字段需要建索引。你掌握这些核心概念，能更好地和 AI 沟通需求。

数据完整性与校验

"数据存进去了，"老师傅问，"但存得对不对？"

他给你举了几个例子：用户把邮箱填成了 hello（格式不对），年龄填成了 -5（范围不对），订单引用了一个不存在的用户 ID（引用完整性）。数据校验就是防止这种情况发生。

老师傅说，校验有三道防线：

第一道防线：数据库约束。在定义 Schema 时用的 .notNull()、.unique()、.references() 就是数据库层面的约束。这些是"铁律"，就算代码有 bug，数据库也会拒绝违规数据。

第二道防线：后端 API 校验。在处理用户请求时，AI 会自动加上校验逻辑。比如邮箱格式、密码长度、枚举值范围等。这能在数据到达数据库前就拦截掉错误。

第三道防线：前端表单验证。用户提交前，浏览器先检查一遍。比如 <input type="email"> 会自动验证邮箱格式，HTML5 的 required、min、max 等属性也能做基本校验。

老师傅提醒你：三道防线各有用处。数据库约束是最后一道保险，后端校验是主要防线，前端校验是为了用户体验（快速反馈，不用等网络请求）。别因为有了前端校验就省略后端和数据库层面的保护——用户可以直接调用 API，绕过前端。

AI 知道在每一层应该加什么校验。你记住"防线不止一道"这个原则，和 AI 协作时就会更有方向。

数据备份

"在讲任何技术之前，"老师傅严肃地说，"先讲数据备份意识。数据是产品的灵魂，备份是开发的底线。很多人忽视了这一点，直到某天数据库崩溃，才发现所有用户数据都丢失了，这是灾难性的后果。

自动化备份不是可选项，而是必修课。备份策略要包括：自动备份（每天）、多地备份（云+本地）、定期恢复演练（验证备份可用）。太多人做了备份但从来没测试过，等到需要恢复时才发现备份文件损坏。

灾难恢复演练的重要性不亚于备份本身。如果没演练过，你根本不知道备份是否真的可用。"

数据库选择

为了实战，你接触到了 SQLite，它是一个轻量级的文件数据库，不需要安装，非常适合开发测试。但为了未来的扩展性，老师傅建议你使用 PostgreSQL。

PostgreSQL 的托管方式：Supabase 和 Neon 是两个流行的托管 PostgreSQL 云服务，但定位不同。

Supabase 是一个完整的 BaaS（Backend as a Service），除了 PostgreSQL 数据库，还提供 Auth 认证、Storage 存储、Realtime 实时订阅、Edge Functions 等功能。如果你想快速验证 MVP，不想操心后端细节，Supabase 是很好的选择。

Neon 则专注于数据库本身，提供无服务器架构的 PostgreSQL，可以按需自动扩缩容，适合对后端有自定义需求的场景。

但老师傅提醒你，本教程推荐使用标准的 PostgreSQL，而不是被任何 BaaS 捆绑。标准 PostgreSQL 让你更深入理解数据库的核心概念，迁移成本更低，未来可以根据需求选择任意托管平台或自建。Supabase、Neon、Railway 等都只是 PostgreSQL 的不同托管方式，你掌握的是数据库本身，而不是某个特定的服务平台。这种"不被捆绑"的思路，在 AI 时代尤为重要。

为什么是 PostgreSQL？举一个最有说服力的例子：OpenAI 的 ChatGPT 后端用的就是 PostgreSQL。他们用单一 PostgreSQL 主库支撑了 8 亿用户，每秒处理百万级查询。如果 PostgreSQL 能扛住 ChatGPT 的规模，那对你来说绝对够用了。

你可能好奇"主库"是什么。简单说一下主从库和高可用的概念：生产环境通常会有一个主库（负责写数据）和多个从库（负责读数据），主库的数据会自动同步到从库。这样既能分散读取压力，又能保证主库出故障时从库能顶上——这就是高可用的基本思路。不过这些是运维层面的事，开发阶段你只需要一个数据库就够用了，托管平台会帮你处理这些。

除了有顶尖 AI 公司背书，PostgreSQL 还有两个让 AI 开发者无法拒绝的特性：

JSONB 支持：它虽然是关系型数据库，但能像 NoSQL 一样直接存 JSON 数据。这意味着你可以把 AI 生成的那些结构不确定的复杂数据直接丢进去，既有规则（SQL）又有灵活性（NoSQL）。
pgvector（向量检索）：这是 AI 时代的杀手锏。它可以存储和查询"向量数据"，这是实现 AI 长期记忆（RAG）的核心技术。选了 PostgreSQL，就等于为你的 AI 应用铺平了未来的路。

实战避坑

开发数据库 vs 生产数据库。老师傅告诉你，在专业团队里，通常会有两套数据库：开发环境用来测试和调试，生产环境给真实用户使用。虽然最佳实践是分离环境，但在学习阶段，用一套数据库快速上手是可以接受的——直接在云端数据库上开发，这样部署时不需要迁移数据，省去了很多麻烦。当你的应用有真实用户后，强烈建议分离开发和生产环境，以避免数据污染和安全风险。

数据标记：既然开发和生产共用一个数据库，怎么区分测试数据和真实数据呢？老师傅教了你两个办法：一是上线前手动清理测试数据；二是在表设计时加一个 isTest 或 isDev 字段，开发时写入的数据都标记为 true，上线后查询时过滤掉这些数据。这样既省钱又安全。

清理测试数据：当你需要删除测试数据时，告诉 AI "把所有测试数据删掉"，它会生成类似 DELETE FROM users WHERE isTest = true 的代码。你看得懂这行代码的意思——只删除标记为测试的数据。这就是 isTest 字段的作用，它像一道安全闸门，确保只会删掉测试数据，不会误伤真实用户。

Connection URL（连接字符串） 你经常看到 Error: Invalid URL 的报错。老师傅告诉你，连接数据库就像寄信，格式必须严格遵守：postgresql://用户名:密码@主机地址:端口/数据库名。任何一个标点符号错了，或者密码里包含了特殊字符（需要转义），都会导致连接失败。

本章目录

#### 8.1 数据存储演进 (./01-数据存储演进.md)
从内存存储到数据库的演进路径,各种存储方式的对比和适用场景。

#### 8.2 关系型数据库基础 (./02-关系型数据库基础.md)
数据库的核心概念:表、主键、外键、关系、约束、索引等。

#### 8.3 后端方案选择 (./03-后端方案选择.md) 🟡
BaaS、Serverless、Traditional Backend 三种方案的对比和选择指南。

#### 8.4 数据库设计的核心理念 (./04-数据库设计的核心理念.md) 🟡
从 PRD 到数据库设计的完整流程,如何识别实体、定义关系、优化结构。

#### 8.5 Drizzle ORM 入门 (./05-Drizzle入门.md)
Drizzle ORM 的安装、Schema 定义、迁移管理、查询构建。

#### 8.6 数据库迁移实战 (./06-数据库迁移实战.md)
迁移工作流、常见迁移场景、生产环境迁移、数据迁移策略。

#### 8.7 CRUD 操作详解 (./07-CRUD操作详解.md)
Create、Read、Update、Delete 的完整用法,查询优化,事务操作。

#### 8.8 Supabase 配置与使用 (./08-Supabase配置与使用.md) 🟡
Supabase 平台的快速上手,数据库操作、身份认证、实时订阅、文件存储。

#### 8.9 数据库选择决策 (./09-数据库选择决策.md) 🟡
PostgreSQL、MySQL、MongoDB、SQLite 等主流数据库的对比和选择建议。

#### 8.10 数据库备份策略 (./10-数据库备份策略.md)
备份类型、策略选择、自动化备份、灾难恢复演练。

#### 8.11 数据库性能优化 (./11-数据库性能优化.md)
查询优化、索引优化、连接池配置、缓存策略、性能监控。

#### 8.12 实战避坑案例 (./12-实战避坑案例.md)
10 个常见错误及解决方案,最佳实践总结。

1.1 编程已死，编程永生：从 Coder 到 Commander

1.2 破除迷信：不懂英文、数学不好也能写代码吗？

1.3 工具初探：AI 编程工具选型指南

1.4 Vibe vs Spec：AI 编程的两种方式

1.5 Hello World：你的第一个 3 分钟 AI 网页

2.1 思维升级：从"我想做一个App"到"我要解决一个问题"

2.2 逆向思维：先想清楚什么会让项目失败

2.3 减法思维：MVP不是「最小功能」，而是「最小可验证价值」

2.4 故事思维：把用户当作故事的主角

2.5 灵魂三问：开发前必须回答的问题

2.6 场景应用：这些思维工具不只是用来「做产品」的

2.7 问题发现：如何找到值得解决的问题

2.8 本章总结：产品经理的思维工具箱

附录：心法篇补充材料

3.1 提示词工程基础：Context is King

3.2 结构化提示词框架

3.3 进阶提示技巧

3.4 编写你的第一份 PRD

3.5 迭代对话的艺术

3.6 当 AI 不听话时

3.7 本章总结与实战演练

附录：常用 Prompt 模板库

4.1 开始之前：整合你的准备工作

4.2 第一轮：搭建页面框架

4.3 第二轮：实现核心功能

4.4 第三轮：让数据活起来

4.5 Debug 实战：当 AI 代码报错时

4.6 收尾与回顾

5.1 后悔药：代码改崩了怎么办

5.2 见世面：把网页发到互联网上

5.3 护城河：AI 时代的安全意识

5.4 再进化：项目的持续迭代与优化

5.5 知边界：Vibe Coding 的能与不能

5.6 启程前：本章总结与进阶预告

0.0 进阶版要学什么——课程概念定义

0.1 计算机基础知识

0.2 命令行：与计算机的直接对话

0.3 前端基础：构建用户眼中的世界

0.3.5 你的电脑如何上网——网络基础：HTTP/HTTPS/域名/端口/API 概念

0.4 搭建你的编程工作室——开发环境配置：Node.js、包管理器与工具链

0.5 从随心所欲到规行矩步——JS → TS 思维转换

0.6 别让你的网站裸奔——开发安全底线

0.7 把程序装进集装箱——Docker 核心概念

1.1 先让 Hello World 跑起来——工具装配与最小项目验证：Node/VSCode/Cursor/Claude；跑通 Next.js

1.2 你不是一个人在战斗——Vibe Coding 心法：从"写代码"到"指挥 AI 写代码"

1.5 全副武装你的开发环境——工具链与环境：IDE/Git/Node.js/数据库/部署平台

2.1 为什么我们选这套装备——Next.js + TS + Prisma + OSS 架构全景

2.2 你的网页何时被创建——Next.js 渲染策略全景

2.3 用对新特性才不香——Next.js 核心概念深入：App Router/RSC/Server Actions 实战

2.4 前后端如何高效协作——接口契约/API Route；请求/响应、幂等、流式返回

2.5 代码为什么会越写越乱——架构分层详解：页面/路由、API/HTTP、服务层/业务、数据层/Prisma+SQL

2.6 全家桶服务好不好用——拓展：Supabase适用与取舍

3.1 你的文件目录就是网站地图——App Router：文件路由与数据获取

3.2 像搭乐高一样构建页面——前端构建块：组件/状态/路由/数据获取/错误与空态

3.4 告别选择困难症——Tailwind + shadcn/ui：统一设计体系与组件库

3.5 别靠猜来找 Bug——Debug 实战：断点/Network/日志/错误边界

3.6 别把厨房建在客厅——API Route 与服务层分离：输入/输出、幂等、鉴权、错误与重试

3.7 崩了和没数据时怎么办——可用性：错误/空态/加载骨架；Error Boundary

3.8 别让少数人用不了你的产品——可访问性/UX 原则/设计令牌/颜色与对比度/i18n

4.1 数据关系要先理清——数据建模与 ER 图：实体/关系/约束；面向变更与演进

4.2 数据库到底在忙什么——关系型数据库：CRUD/索引/事务

4.3 如何命令数据库干活——SQL 基础操作：表/行/列、主键/外键、索引、事务、JOIN、CRUD

4.4 告别手写 SQL——Prisma 实战应用

4.5 线上数据库动手术——数据库迁移策略：生产环境的变更管理

4.6 如何批量制造假数据——种子数据高级应用：多环境数据管理

4.7 数据打架了怎么办——数据同步：幂等/冲突处理

4.8 拓展：Supabase 为何如此强大——存储与认证联动

5.1 先把想做的说明白——AI 时代产品开发理念：从传统开发到 AI 协助全流程

5.2 为什么说先写文档再编码——PRD 基础

5.3 不会提需求怎么办——让 AI 帮你问对问题

5.4 你写的文档 AI 看得懂吗——AI 可读的 PRD 文档生成：结构化与机器友好

5.5 先讲故事再列清单——用户故事、问题陈述、范围与优先级矩阵

5.6 方案是用来减风险的——技术方案要点：接口/数据表/边界/风险；单人自评

5.7 别让文档烂尾——文档即代码：目录与 PR 同步更新

6.1 别再从零开始写登录注册——NextAuth 快速上手：Google/GitHub 登录实战

6.2 你是谁与你能做什么——认证与授权安全实践

6.3 守好程序的大门——API 安全防护实践

6.4 认识常见的网络小偷——常见 Web 安全威胁与防护

6.5 接入微信/QQ 登录——第三方登录集成深度：微信/QQ/钉钉/企业微信

7.1 接口是合同不是暗语——HTTP 与 API：方法、JSON、分页与过滤、幂等与重试

第八章：数据持久化与数据库