【手写数据库内核miniToadb】第2天 与数据库交互的桥梁--SQL解绍

【手写数据库内核miniToadb】第2天 与数据库交互的桥梁--SQL解绍
专栏内容手写数据库toadb
本专栏主要介绍如何从零开发,开发的步骤,以及开发过程中的涉及的原理,遇到的问题等,让大家能跟上并且可以一起开发,让每个需要的人成为参与者,在开源无限的公众号更新会更及时。

一、概述


上一节通过一个简单的C语言程序来模拟数据库的行为,从处理能力来看,也有创建表,插入、删除、更新、查询等操作,但是与大家认为的数据库差距很大。

关系型数据库的一个很明显的特点,就是有标准的操纵数据库的语言,它就是常用的SQL。我们来开发的数据库内核支持这一标准SQL,这样才能符合数据库的一个审美。

说到语言,就不得不做语言的解析了,类似于自然语经过人脑分析后,转换为一系列人的动作行为;而数据库中的解析模块要把用户的SQL表达的意图经过词法和语法分析,转换成程序可处理的数据结构。

这听起来还是很有意思的,那么我们现在就开始这第一步吧。

在开始之前再补充一些内容,整个开发过程主要使用C语言开发,在解析中会用到正则表达式和上下文无关语法,它们占比非常小。

开发所用的系统是CentOS 8.2,当然其它linux版本可能命令会有差异,Centos系列还是比较一致,可以看到后面都会使用Makefile、gcc等编译工具;

源码编辑器可以使用流行的VScode,支持跨平台,当然也可以使用Eclipse,或者自己熟悉的其它工具,不同编辑器之间的默认字符集可能不同,最好设置为UTF-8,Linux下的换行模式,统一的格式避免一些奇妙的问题。

二、SQL简述


SQL,全称为Structured Query Language,即结构化查询语言,是一种专门用来与数据库进行通信的语言。

2.1 发展历史

  • SQL语言的发展始于1974年,由IBM公司的Boyce和Chamberlin提出,并在IBM研制的关系数据库系统System R上实现。SQL的设计初衷是为了提高数据库查询效率,但随着时间的发展,SQL的功能已经扩展到数据的插入、更新和删除等操作。
  • 1986年,SQL成为美国国家标准(ANSI)和国际标准化组织(ISO)的标准,随后在1987年成为国际标准。

2.2 SQL的功能

按功能的不同,将SQL划分为DQL,DDL,DML,DCL等类型,经常使用的查询,插入更新等就属于DQL和DML范围。

在这里插入图片描述
  • 数据查询(DQL):Data Query Language, 使用SELECT语句从数据库中检索数据。查询操作的灵活性体现在能够根据需要选择特定的列或行,使用WHERE子句进行条件筛选,以及通过ORDER BY进行排序等。
  • 数据定义(DDL):Data Definition Language, 使用CREATE、ALTER和DROP等语句来定义数据库结构,如创建新表或修改、删除表。CREATE语句用于生成新的数据库对象、视图或索引;ALTER用于修改现有结构,如添加或删除列;DROP语句则用于删除数据库对象。
  • 数据操纵(DML):Data Manipulation Language, 使用INSERT、UPDATE和DELETE等语句来插入、更新或删除数据库中的数据。
  • 数据控制(DCL):Data Control Language, 使用GRANT和REVOKE等语句来控制数据库的访问权限。
  • 事务控制(TCL):Transaction Control Language, 提供BEGIN TRANSACTION、COMMIT和ROLLBACK等语句用于管理事务,确保数据库操作的原子性、一致性、隔离性和持久性(ACID属性)。
  • 存储过程和触发器:允许创建存储过程和触发器,这些数据库对象可以在特定事件或条件下自动执行一系列预定义的SQL语句。
  • 嵌入式SQL和SQL API:SQL的嵌入式实现允许它被直接嵌入到高级编程语言中,如Java、C#等,通过特定的API调用来执行数据库操作。

2.3 SQL标准的发展

SQL标准的发展是一个不断演进的过程,旨在提高数据库的互操作性、可扩展性和性能。

  1. 早期发展
    • 1970年代初,IBM公司的埃德加·科德提出了关系数据库的概念,为SQL的诞生奠定了基础。
    • 1974年,IBM的D.D.Chamberlin和R.F.Boyce在研制关系数据库管理系统System R时,研制出一套规范语言SEQUEL(Structured English QUEry Language),并在1976年11月的IBM Journal of R&D上公布新版本的SQL(叫SEQUEL/2)。1980年改名为SQL。
  2. 标准化过程
    • 1986年,美国ANSI采用SQL作为关系数据库管理系统的标准语言(ANSI X3.135-1986),后为国际标准化组织(ISO)采纳为国际标准。
    • 1989年,美国ANSI采纳在ANSI X3.135-1989报告中定义的关系数据库管理系统的SQL标准语言,称为ANSI SQL 89,该标准替代ANSI X3.135-1986版本。
  3. 持续更新
    • 自1989年以来,SQL标准经历了多次更新和完善,如SQL-92、SQL-99等版本。
    • 这些更新旨在添加新功能、提高性能、增强与其他技术的集成等。
  4. 最新标准
    • 国际标准化组织ISO于2023年6月1日正式发布了最新SQL标准,即SQL:2023。
    • SQL:2023标准包含了多个部分,涵盖了SQL语言的基本框架、基本原则、调用级接口、持久存储模块、外部数据管理、对象语言绑定、信息与定义概要等多个方面。
    • 新增了第16部分SQL/PGQ,支持图形查询语言GQL,增强了SQL对图形数据处理的能力。
    • 强化了SQL语言和JSON功能,以更好地支持现代应用的需求。

SQL标准的发展经历了多个阶段,并持续得到更新和完善。最新SQL标准(SQL:2023)的发布为数据库技术的发展注入了新的活力,并推动了数据库系统的不断创新和进步。

大家对数据库内核有兴趣的话,可以关注我,从今天开始从零编写一个可以使用的数据库内核。

Read more

【Linux系列】并发世界的基石:透彻理解 Linux 进程 — 进程优先级切换调度

【Linux系列】并发世界的基石:透彻理解 Linux 进程 — 进程优先级切换调度

🫧 励志不掉头发的内向程序员:个人主页  ✨️ 个人专栏: 《C++语言》《Linux学习》 🌅偶尔悲伤,偶尔被幸福所完善 👓️博主简介: 文章目录 * 前言 * 一、基本概念 * 二、查看系统进程 * 三、PRI and NI * 四、查看进程优先级的命令 * 五、补充概念 - 竞争、独立、并行、并发 * 六、进程切换 * 七、Linux2.6内核进程O(1)调度队列 * 7.1、一个CPU拥有一个runqueue * 7.2、优先级 * 7.3、活动队列 * 7.4、过期队列 * 7.5、active指针和expired指针

By Ne0inhk
ARM Linux 驱动开发篇---Linux 设备树(DTS)语法-- Ubuntu20.04

ARM Linux 驱动开发篇---Linux 设备树(DTS)语法-- Ubuntu20.04

🎬 渡水无言:个人主页渡水无言 ❄专栏传送门: 《linux专栏》   《嵌入式linux驱动开发》 ⭐️流水不争先,争的是滔滔不绝  📚博主简介:第二十届中国研究生电子设计竞赛全国二等奖 |国家奖学金 | 省级三好学生 | 省级优秀毕业生获得者 | ZEEKLOG新星杯TOP18 | 半导纵横专栏博主 | 211在读研究生 在这里主要分享自己学习的linux嵌入式领域知识;有分享错误或者不足的地方欢迎大佬指导,也欢迎各位大佬互相三连 目录 前言 一、DTS 文件的整体结构 二、.dtsi 头文件 三、设备节点 3.1、设备节点整体结构 3.2、节点命名规则 3.3节点属性 四、标准属性 4.1. compatible 属性 4.1.1、基本格式 4.2、model 属性

By Ne0inhk

Antigravity Linux 版本安装指南:完美解决海外软件源添加后的网络连接难题

一、项目场景: 在 Linux 环境下配置海外软件源 "Antigravity": 当我们需要在系统中添加第三方软件包仓库源(Repository),并希望通过 apt install 快速安装和持续更新软件时,经常会遇到仓库服务器位于海外(如 Google Artifact Registry)的情况。 二、问题描述 APT Update 过程中出现 HTTPS 连接超时 三、原因分析: 这是典型的“跨境链路延迟”与“内部路由策略冲突”导致的问题: 1. 常规网络环境: 终端在连接海外高带宽仓库(如 us-central1-apt.pkg.dev)时,由于跨境物理链路波动或路由节点较多,极易出现 Handshake 超时。 2. 全局加速模式: 当开启全局网络加速(如网关转发或虚拟网卡模式)

By Ne0inhk
【Linux】一切皆文件:深入理解文件与文件IO

【Linux】一切皆文件:深入理解文件与文件IO

目录 一、理解文件 1.1、文件的概念 1.2、文件的认知 二、回顾C文件 2.1、C文件接口 2.2、实现cat 指令 2.3、stdin & stdout & stderr 三、系统文件IO 3.1、传递标志位的方法 常用的标志位: 3.2、系统调用接口 1、open——打开文件 2、close——关闭文件 3、write——写文件 4、read——读文件 3.3、文件描述符 文件描述符分配规则:

By Ne0inhk