Web基础

万维网(Web)的四大核心构成

万维网的四大核心构成包括超文本传输协议(HTTP)、超文本标记语言(HTML)、统一资源定位符(URL)和超链接(Hyperlink)。这些技术共同支撑了现代互联网的基础架构。

超文本传输协议(HTTP)

HTTP是客户端和服务器之间通信的基础协议,用于传输超文本数据。它定义了请求和响应的格式,支持GET、POST等方法来获取或提交资源。HTTP是无状态的,但通过Cookie等技术可以实现会话管理。

超文本标记语言(HTML)

HTML是用于创建和设计网页的标准标记语言。它通过标签定义网页的结构和内容,如标题、段落、图像和链接。HTML5引入了更多语义化标签和多媒体支持,增强了网页的表现力和交互性。

统一资源定位符(URL)

URL是用于标识互联网上资源位置的字符串。它由协议、域名、路径和查询参数等部分组成。例如,https://example.com/path?query=value。URL确保用户和程序能够准确访问特定的网络资源。

超链接(Hyperlink)

超链接是连接不同网页或资源的桥梁,通常以可点击的文本或图像形式呈现。它通过HTML的<a>标签实现,指向另一个URL。超链接是万维网“网状”结构的核心,实现了信息的互联互通。

这些技术共同构成了万维网的基础,使得信息的发布、检索和共享成为可能。

Web服务器的基本概念

Web服务器是一种软件或硬件系统,负责处理客户端(如浏览器)的HTTP请求,并返回响应(如HTML页面、图像或数据)。常见的Web服务器软件包括Apache、Nginx、IIS等。

主流Web服务器软件

Apache

  • 开源且跨平台,支持模块化扩展。
  • 适合动态内容处理,如与PHP结合使用。
  • 配置灵活,但高并发场景下性能可能受限。

Nginx

  • 高性能,擅长处理静态内容和反向代理。
  • 事件驱动架构,支持高并发连接。
  • 常用于负载均衡和缓存加速。

Microsoft IIS

  • 专为Windows设计,深度集成.NET框架。
  • 图形化界面管理,适合企业级应用。

Web服务器的工作原理

  1. 接收请求:客户端通过HTTP/HTTPS协议发送请求。
  2. 处理请求:服务器解析请求(如URL、方法GET/POST)。
  3. 生成响应:返回静态文件或调用后端程序(如PHP、Node.js)。
  4. 发送响应:将HTML、JSON等数据返回客户端。

Web访问流程概述

Web访问流程描述了从用户在浏览器输入URL到页面加载完成的完整过程,涉及DNS解析、TCP连接、HTTP请求与响应、页面渲染等关键步骤。

DNS解析

用户在浏览器输入URL后,系统首先通过DNS(域名系统)将域名转换为对应的IP地址。DNS查询遵循递归或迭代方式,依次检查浏览器缓存、操作系统缓存、路由器缓存、ISP DNS服务器,直至根域名服务器。

建立TCP连接

获取目标服务器IP后,客户端通过TCP三次握手与服务器建立连接。步骤如下:

  1. 客户端发送SYN(同步)报文到服务器。
  2. 服务器回应SYN-ACK(同步-确认)报文。
  3. 客户端发送ACK(确认)报文完成握手。

若启用HTTPS,还需进行TLS握手协商加密协议。

发送HTTP请求

TCP连接建立后,浏览器构造HTTP请求报文,包含请求方法(如GET/POST)、请求头(如User-Agent、Accept)、请求体(如POST数据)。示例GET请求:

GET /index.html HTTP/1.1 Host: example.com User-Agent: Mozilla/5.0 

服务器处理请求

服务器接收请求后,根据路径和参数处理请求,可能涉及后端程序(如PHP、Node.js)或静态文件直接返回。响应包括状态码(如200 OK)、响应头(如Content-Type)和响应体(如HTML内容)。

浏览器渲染

浏览器解析响应内容,逐步加载HTML、CSS、JavaScript及图片等资源:

  • 构建DOM树:解析HTML生成文档对象模型。
  • 构建CSSOM:解析CSS生成样式规则树。
  • 执行JavaScript:可能阻塞渲染,需优化加载顺序。
  • 生成渲染树:合并DOM与CSSOM,计算布局。
  • 绘制页面:根据渲染树进行像素级绘制。

连接终止

页面加载完成后,TCP连接通过四次挥手释放:

  1. 客户端发送FIN报文。
  2. 服务器回应ACK报文。
  3. 服务器发送FIN报文。
  4. 客户端回应ACK报文,等待超时后关闭连接。

性能优化方向

  • 减少DNS查询:使用DNS预解析或减少域名数量。
  • 复用连接:启用HTTP/2或Keep-Alive避免重复握手。
  • 压缩资源:Gzip压缩文本文件,优化图片格式。
  • 延迟加载:异步加载非关键资源(如JavaScript)。

Web服务器漏洞类型及防护措施

常见漏洞类型

  • 注入漏洞:SQL注入、OS命令注入等攻击方式,通过未过滤的用户输入执行恶意代码。
  • 跨站脚本(XSS):攻击者注入客户端脚本,窃取用户会话或篡改网页内容。
  • 配置错误:默认配置、未关闭的调试接口或暴露的敏感文件(如.git目录)。
  • 拒绝服务(DoS/DDoS):通过大量请求耗尽服务器资源导致服务瘫痪。
  • 过时组件:未更新的Web服务器软件(如Apache/Nginx旧版本)或存在已知漏洞的依赖库。

检测与修复方法

  • 使用自动化工具(如Nessus、OpenVAS)扫描漏洞,定期进行渗透测试。
  • 对用户输入实施严格过滤和验证,采用参数化查询防止SQL注入。
  • 配置Web应用防火墙(WAF)拦截恶意流量,如ModSecurity。
  • 及时安装安全补丁,移除不必要的服务和默认账户。

安全加固实践

  • 最小化权限原则:限制服务器进程和数据库账户的权限。
  • 启用HTTPS并配置HSTS,使用强加密算法(如TLS 1.3)。
  • 日志监控:记录访问日志和错误日志,设置异常行为告警。

代码示例(防护SQL注入)

# 使用参数化查询(Python示例) import sqlite3 conn = sqlite3.connect('example.db') cursor = conn.cursor() user_input = "admin' OR 1=1--" cursor.execute("SELECT * FROM users WHERE username=?", (user_input,)) # 安全 

数学公式(DoS攻击模型)
攻击流量阈值计算:
$$
T_{attack} = \frac{C_{server}}{R_{request}}
$$
其中,(C_{server})为服务器承载能力,(R_{request})为单请求资源消耗。

 

Read more

Git国内极速下载与安装全攻略:无需翻墙的完整解决方案

Git国内极速下载与安装全攻略:无需翻墙的完整解决方案

在国内使用Git时,由于网络限制,直接从官方源下载安装包或克隆仓库往往速度缓慢甚至失败。本文将提供一套完整的国内镜像解决方案,涵盖从Git软件安装到日常使用加速的全流程,帮助开发者无需翻墙即可高效完成Git相关操作。 一、国内镜像源安装Git 1.1 选择国内镜像源下载安装包 国内多所高校和企业提供了Git安装包的镜像服务,下载速度远超国际源: * 中科大镜像源 :https://mirrors.ustc.edu.cn/git/ * 清华大学镜像源 :https://mirrors.tuna.tsinghua.edu.cn/git/ * 阿里云镜像源 :https://registry.npmmirror.com/binary.html?path=git-for-windows/ * 码云(Gitee)镜像 :https://gitee.com/mirrors/git-for-windows 推荐优先使用阿里云或中科大镜像,更新频率高且下载稳定 1.2 各系统安装步骤

By Ne0inhk
保姆级教程:Windows Git 安装全流程,手把手带你从 0 到 1 (2025版)

保姆级教程:Windows Git 安装全流程,手把手带你从 0 到 1 (2025版)

Git 是程序员的必备工具。对于 Windows 用户来说,安装过程中的几十个英文选项往往让人头大。本教程将手把手带您走完安装流程,确保您的环境配置最优化、最符合现代开发标准。 第一步:下载安装包 1. 下载地址 * 官方网站:git-scm.com/download/win * 下载方式:推荐直接点击页面上的 "Click here to download" 或者 "Git for Windows/x64 Setup" 下载独立的 .exe 安装程序。 * 注:虽然可以用 Winget 命令行下载,但传统安装包更适合初次配置。 2. 版本选择 (x64 vs ARM64) * 绝大多数电脑(Intel/AMD

By Ne0inhk

上传本地文件(夹)代码到GitHub 超详细讲解最全命令集合(配图 适用全部)

下面我用最稳妥、最常用的方式,手把手教你把本地代码文件夹上传到 GitHub。不管你是第一次用 GitHub,还是之前总出错,按这个来基本不会翻车。 【注意】:https://github.com/beiyang366/LYVCSHOP  为作者的GitHub 仓库地址  一、准备工作(只需一次) 1️⃣ 注册 / 登录 GitHub 👉 https://github.com 登录即可(你应该已经有了) 2️⃣ 安装 Git(如果没装) 📥 下载地址(Windows / macOS / Linux): 👉 https://git-scm.com/ 安装完成后,打开 命令行 / Git Bash,输入: git --version 能看到版本号说明安装成功 ✅ 二、在

By Ne0inhk

DeepSeek-Coder-V2开源:128K上下文的AI编程利器

导语:深度求索(DeepSeek)正式开源新一代代码大模型DeepSeek-Coder-V2,以128K超长上下文、338种编程语言支持和比肩GPT-4 Turbo的性能,为开发者带来全新的AI编程体验。 【免费下载链接】DeepSeek-Coder-V2-Base开源代码智能利器DeepSeek-Coder-V2,性能比肩GPT4-Turbo,支持338种编程语言,128K代码上下文,助力编程如虎添翼。 项目地址: https://ai.gitcode.com/hf_mirrors/deepseek-ai/DeepSeek-Coder-V2-Base 行业现状:代码大模型进入"性能与开放"双轨竞争时代 随着生成式AI技术的快速发展,代码大模型已成为提升软件开发效率的关键工具。近年来,从GitHub Copilot到Cursor等基于大模型的编程辅助工具不断涌现,推动着开发范式的变革。据行业研究显示,配备AI辅助工具的开发者完成相同任务的效率平均提升30%以上,尤其在代码生成、调试和文档撰写方面表现突出。 当前市场呈现出"闭源商业模型"与"开源社区模型"并行发展的格局。闭源模

By Ne0inhk