Linux网络 | 理解Web路径 以及 实现一个简单的helloworld网页

Linux网络 | 理解Web路径 以及 实现一个简单的helloworld网页
        前言:本节内容承接上节课的http相关的概念, 主要是实现一个简单的接收http协议请求的服务。这个程序对于我们理解后面的http协议的格式,报头以及网络上的资源的理解, 以及本节web路径等等都有着重要作用。 可以说我们就用代码来理解这些东西。 那么废话不多说, 现在开始我们的学习吧。

        ps:本节内容建议先看一下上一篇文章http的相关概念哦:linux网络 | 深度学习http的相关概念-ZEEKLOG博客

目录

 准备文件

 makefile

HttpServer.hpp

类内成员

封装sockfd

start

 ThreadRun

 全部代码

运行结果

响应书写

Web路径


 准备文件

        首先准备文件:

这里面Httpserver.cc用来运行接收http请求的服务。 HttpServer.hpp用来定义http请求。Log.hpp就是一个打印日志的小组件, Socket.hpp同样是套接字的组件。 到使用直接调用相关接口即可。(Log.hpp和Socket.hpp如何实现不讲解, 如果想要知道, 请看博主的相关文章)

日志程序:

linux进程间通信——命名管道、 日志程序_进程间通信日志系统-ZEEKLOG博客



Socket套接字:

linux网络 | 序列化反序列化的概念 与 结合网络计算器深度理解-ZEEKLOG博客

 makefile

        先将mkefile准备出来:

HttpServer:Httpserver.cc g++ -o $@ $^ -std=c++11 -g -lpthread .PHONY:clean clean: rm -rf HttpServer

HttpServer.hpp

类内成员

class HttpServer { public: HttpServer(uint16_t port = defaultport) :port_(port) {} static void* ThreadRun(void* args) { } void start() { } ~HttpServer() {}; private: Socket listensock_; uint16_t port_; };

        类内的成员变量就是port_端口号, 到时候启动服务, 就输入一个端口号来启动我们的服务。 然后listensock是我们要接收到哪个主机的请求。 所以我们可以在开始工作的时候再初始化的同时直接accept进行连接。 这个ThreadRun是因为博主要用线程来管理服务, 这个函数就是线程要执行的方法。

封装sockfd

        封装sockfd就是对scokfd进行一下封装:

struct ThreadData { int sockfd; }; 

         这么做的目的是为了能够将ThreadData的指针传给线程, 让线程拿到sockfd。就是ThreadRun这个函数。 这个函数创建在类内必须是静态成员。 否则就不能作为线程的执行方法。 而变成静态成员又不能直接使用sockfd。 所以我们就使用了ThreadData*类型的对象传给线程方法。 这样线程就能使用sockfd了。 

start

        看一下start函数, start就是服务启动后, 就执行这个函数。 先初始化, 再绑定, 然后开启监听。 然后就接收服务就行。 当有请求发来时, 那么listensock就能与对方建立连接获得sockfd。 拿到sockfd就封装起来传给线程, 让线程去执行。 

 void start() { listensock_.InitSocket(); //初始化sockfd listensock_.Bind(port_); //绑定 listensock_.Listen(); //监听 for (;;) { string clientip; //请求方ip uint16_t clientport; //请求方port //建立连接: int sockfd = listensock_.Accept(&clientip, &clientport); //接收请求 pthread_t tid; ThreadData* td = new ThreadData(); td->sockfd = sockfd; pthread_create(&tid, nullptr, ThreadRun, td); } }

 ThreadRun

        线程执行的过程就是创建一个缓冲区, 然后从sockfd中读取数据到缓冲区当中。 

 static void* ThreadRun(void* args) { pthread_detach(pthread_self()); //先让线程分离。 //将args,也就是封装起来的ThreadData类型强转一下。 ThreadData* td = static_cast<ThreadData*>(args); //创建缓冲区。 char buffer[10240]; ssize_t n = read(td->sockfd, buffer, sizeof(buffer) - 1); //从某个地方读取, 然后读取的数据放到buffer里面。 从哪里读取, if(n > 0) { buffer[n] = 0; cout << buffer; } close(td->sockfd); delete td; return nullptr; }

 全部代码
 

#ifndef BE0E1813_421A_4BCD_A33B_77432A3CA8D7 #define BE0E1813_421A_4BCD_A33B_77432A3CA8D7 #include<iostream> #include"Socket.hpp" #include"Log.hpp" #include<pthread.h> //创建端口号。 static const int defaultport = 8080; struct ThreadData { int sockfd; }; class HttpServer { public: HttpServer(uint16_t port = defaultport) :port_(port) {} static void* ThreadRun(void* args) { pthread_detach(pthread_self()); ThreadData* td = static_cast<ThreadData*>(args); char buffer[10240]; ssize_t n = read(td->sockfd, buffer, sizeof(buffer) - 1); //从某个地方读取, 然后读取的数据放到buffer里面。 从哪里读取, if(n > 0) { buffer[n] = 0; cout << buffer; } close(td->sockfd); delete td; return nullptr; } void start() { listensock_.InitSocket(); listensock_.Bind(port_); listensock_.Listen(); for (;;) { string clientip; uint16_t clientport; int sockfd = listensock_.Accept(&clientip, &clientport); pthread_t tid; ThreadData* td = new ThreadData(); td->sockfd = sockfd; pthread_create(&tid, nullptr, ThreadRun, td); } } ~HttpServer() {}; private: Socket listensock_; uint16_t port_; }; #endif /* BE0E1813_421A_4BCD_A33B_77432A3CA8D7 */ 

运行结果

        先启动服务

        然后就是打开浏览器, 输入我们的服务器ip:端口号。 就能请求到这个服务了。 然后就能看到我们的服务这里有了反应: 

        这就说明, 我们浏览器, 确实能够访问到我们的创建的http服务。 

        在上面获得的这些信息中, 我们看一下这个User-Agent。 这个就是请求到服务器的机器的信息。 就是我们利用一台机器访问一个网站或者网页,笼统的说叫做资源。 然后浏览器就把我们的机器的信息传给了服务端。服务端接收的时候就能接收到了。

响应书写

        我们可以将响应单独封装起来。 如下:

 static void HandlerHttp(int sockfd) { char buffer[10240]; ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0); //从某个地方读取, 然后读取的数据放到buffer里面。 从哪里读取, if(n > 0) { buffer[n] = 0; cout << buffer; // //返回响应的过程。 } close(sockfd); } static void* ThreadRun(void* args) { pthread_detach(pthread_self()); ThreadData* td = static_cast<ThreadData*>(args); HandlerHttp(td->sockfd); delete td; return nullptr; }

        到时候线程执行方法, 就执行ThreadRun函数就行了。然后ThreadRun函数就去处理请求。 

HandleHttp就是处理请求的函数。 这个函数里面是先接收请求。 然后就进行响应。

        关于响应我们上节内容讲到过, 第一行就是对响应行。 然后下面的多行就是报头。 最后报头和正文部分有空行。 现在我们书写一下:

 static void HandlerHttp(int sockfd) { char buffer[10240]; ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0); //从某个地方读取, 然后读取的数据放到buffer里面。 从哪里读取, if(n > 0) { buffer[n] = 0; cout << buffer; // //返回响应的过程。 //先写正文内容 string text = "hello world"; //然后写一下响应行 string response_line = "HTTP/1.0 200 OK\r\n"; //然后再写报头, 这里我们的报头只写正文的长度, 因为我们只讲了正文长度。 剩下的属性后面再讲。 string response_header = "Content-Length: "; response_header += to_string(text.size()); response_header += "\r\n"; //空行 string blank_line = "\r\n"; //然后把所有的数据加到要发送到相应里面。 string response; response += response_line; response += response_header; response += blank_line; response += text; //发送 send(sockfd, response.c_str(), response.size(), 0); } close(sockfd); }

然后我们运行之后, 再从浏览器进行请求就请求到了字符串资源:hello world:

         这样我们就能实现一个简单的处理http请求的服务了。

Web路径

        我们知道, 我们的http服务, 我们平时使用浏览器, 都是访问一个网页, 或者访问一张图片。 

        其实, 我们的正文这里是可以写一个网页, 作为响应发送给请求方。 那么网页怎么写, 这个是Web的知识点,本节不做讲解(其实博主也不会, 但是博主特意找了一个学过Web的朋友, 请他把他的Web大作业给了博主。 现在博主有一个html了)。

        我们这里简单的使用一下Web语句, 我们把正文部分改成下面的语句:

string text = "<html><body>hello world</body></html>"; //其中html代表html文档, body就是代表网页正文。 /就是代表正文结尾或者文档结尾。 

        我们也可以给hello world做成标签:

string text = "<html><body><h3>hello world</h3></body></html>"; //h1到h6是六级标签, /的意思同样是结束标志

         然后我们再运行就能看到这个world变了。

        我们做出一个简单的网页之后。 

        但是我们知道, 我们要访问的资源, 其实是带有路径的。 而路径的根目录是web根目录。 那么这个web路径和我们上面写的正文字符串有什么联系呢?

        那么我们这里还要知道另一个知识点, 就是如果我们只是访问ip + 端口号。 那么浏览器会默认给我们访问/(web根目录), 访问的是web根目录下面的资源; 如果后面加了路径, 那么就被称作web路径, 访问的是对应的web路径下面的资源。 

        但是我们上面是使用的字符串作为正文啊, 不是一个路径, 就是一个字符串。所以无论我们后面加什么路径, 访问得到的相应都是hello world。 

 

        所以我们上面写的字符串其实不是正统的网页写法。 正统的网页, 应该是一个文件!!!

        所以, 我们现在就可以捋清楚服务器响应请求的过程:

        就是我们现在可以写出自己的报头, 写出请求行。 然后我们可以把资源目录(web目录)拼接到正文。

        然后用户在访问我们的服务器时, 就可以根据他想要的资源, 访问相应的路径!!!!

 

         那么, 这个资源目录怎么拼接到正文, 知道了这个, 我们也就知道了什么是Web路径。 

        Web根目录, 其实是可以自己指定的, 可以是linux的根目录, 也可以是当前目录,也可以是其他路径。

        现在, 我们定义一个Web根目录为当前目录下的wwwroot文件:

const string wwwroot = "./wwwroot"; //定义web根目录为当前目录。
         所以, 未来, 我们的wwwroot文件夹就是一个web目录。 以后我们的网页, 我们的图片, 都放到这个文件下面。 用户访问网页的时候, 只能以该目录为根节点, 往下访问!!!!而往下访问到的任何一个路径, 都叫做Web路径!!!

        有了Web目录之后, 我们以后写的html代码就写到Web目录里面: 

        为了让我们的正文不再是静态的代码, 而是一个根据我们用户的请求, 想要访问的网页, 那么我们可以使用read函数读取网页。 

        接下来的工作就是读取文件!

        封装代码:

 static string ReadWebContent(string path) { //注意, 这里读取文件可能读到的是不完整的!所以有坑, 但是本节内容不管。 ifstream in(path); //打开对应路径的文件 if (!in.is_open()) return "404"; //文件路径没有, 直接返回404 string content; string line; while (getline(in, line)) //一行一行的读取 { content += line; } in.close(); return content; //读取完毕之后返回结果 } 

        封装好了函数之后, 我们以后text就直接等于text = ReadWebContent(某个路径)就行了:

         而这个路径, 不正是用户发来的请求里面包含的吗?

        所以,我们从请求里面提取路径,而我们说路径是在url里面的, 而url又在请求行的第二个部分。只要我们从这里面得到路径, 假如是/a/b/c, 那么我们再wwwroot += /a/b/c, 不就等于我们要访问的是./wwwroot/a/b/c了吗?所以, wwwroot,就叫做Web根目录!而且, 我们还可以直接创建一个配置文件,就叫config

        这样以后, 我们的Web根目录, 就根据我们的想法, 想在哪就在哪!不需要改变程序, 只需要改配置文件!!!!

         所以, 接下来的工作就是在处理请求:我们需要重新定义一个请求类:

 //有了这个请求类之后, 我们以后所有的请求都放到这里对象里面。 class Request { public: void Deserialize(string req) { string tmp; int pos = 0; //切割字符串 while (true) { pos = req.find(sep); if (pos == string::npos) break; string temp = req.substr(0, pos); if (temp.empty()) break; req_header.push_back(temp); req.erase(0, pos + sep.size()); } //剩下的都是正文 text = req; DebugPrint(); } //对请求进行打印。 void DebugPrint() { cout << "------------------------------------------------------------" << endl; for(auto& e : req_header) { cout << e << endl << endl; } cout << text << endl; } public: vector<string> req_header; //请求行 string text; //请求正文 };

        然后我们测试一下我们写的请求类是否正确, 先不写了响应, 先Debug一下:

 

        是正确的, 接下来, 我们就要拿到url。 所以我们要给request进一步分割:

        然后就可以拿到路径了。 但是这里还有最后一个问题。就是如果我们的用户访问的是根目录/, 那么不久拿到了当前路径下的所有资源了吗? 但是实际上我们在访问网页的时候只会访问到一个网页, 比如www.baidu.com, 我们是不是就访问到了一个首页? 所以, 我们的路径还要处理一下:

        然后我们的所有代码就完成了, 下面看一下运行结果:

        我们可以发现, 我们访问到了!以上就是我们的所有内容啦, 下面是全部代码!

#ifndef BE0E1813_421A_4BCD_A33B_77432A3CA8D7 #define BE0E1813_421A_4BCD_A33B_77432A3CA8D7 #include<iostream> #include"Socket.hpp" #include"Log.hpp" #include<sstream> #include<pthread.h> #include<vector> #include<fstream> //创建端口号。 static const int defaultport = 8080; const string wwwroot = "./wwwroot"; //定义web根目录为当前目录下的wwwroot 。 const string sep = "\r\n"; const string homepage = "index.html"; class HttpServer; struct ThreadData { ThreadData(int sock) : sockfd(sock) {} int sockfd; }; //有了这个请求类之后, 我们以后所有的请求都放到这里对象里面。 class Request { public: void Deserialize(string req) { string tmp; int pos = 0; //切割字符串 while (true) { pos = req.find(sep); if (pos == string::npos) break; string temp = req.substr(0, pos); if (temp.empty()) break; req_header.push_back(temp); req.erase(0, pos + sep.size()); } parse(); //剩下的都是正文 text = req; DebugPrint(); } //对请求进行打印。 void DebugPrint() { cout << "------------------------------------------------------------" << endl; for(auto& e : req_header) { cout << e << endl << endl; } cout << method << endl << url << endl << http_version << endl << path << endl; cout << text << endl; } //解析第一行 void parse() { stringstream ss(req_header[0]); //stringstream要包含头文件sstream ss >> method >> url >> http_version; path = wwwroot; // ./wwwroot if (url == "/" || url == "/index.html") { path += "/"; // ./wwwroot/ path += homepage; // ./wwwroot/a/b/c } else { path += url; } } public: vector<string> req_header; //请求行 string text; //请求正文 string method; string url; string http_version; string path; }; class HttpServer { public: HttpServer(uint16_t port = defaultport) :port_(port) {} static string ReadWebContent(string str) { //注意, 这里读取文件可能读到的是不完整的!所以有坑, 但是本节内容不管。 ifstream in(str); if (!in.is_open()) return "404"; //文件路径没有, 直接返回404 string content; string line; while (getline(in, line)) { content += line; } in.close(); return content; } static void HandlerHttp(int sockfd) { char buffer[10240]; ssize_t n = recv(sockfd, buffer, sizeof(buffer) - 1, 0); //从某个地方读取, 然后读取的数据放到buffer里面。 从哪里读取, if(n > 0) { buffer[n] = 0; //处理请求 Request req; req.Deserialize(buffer); req.DebugPrint(); //返回响应的过程。 //先写正文内容 string text = ReadWebContent(req.path); //然后写一下响应行 string response_line = "HTTP/1.0 200 OK\r\n"; //然后再写报头, 这里我们的报头只写正文的长度, 因为我们只讲了正文长度。 剩下的属性后面再讲。 string response_header = "Content-Length: "; response_header += to_string(text.size()); response_header += "\r\n"; //空行 string blank_line = "\r\n"; //然后把所有的数据加到要发送到相应里面。 string response; response += response_line; response += response_header; response += blank_line; response += text; //发送 send(sockfd, response.c_str(), response.size(), 0); } close(sockfd); } static void* ThreadRun(void* args) { pthread_detach(pthread_self()); ThreadData* td = static_cast<ThreadData*>(args); HandlerHttp(td->sockfd); delete td; return nullptr; } void start() { listensock_.InitSocket(); listensock_.Bind(port_); listensock_.Listen(); for (;;) { string clientip; uint16_t clientport; int sockfd = listensock_.Accept(&clientip, &clientport); pthread_t tid; ThreadData* td = new ThreadData(sockfd); td->sockfd = sockfd; pthread_create(&tid, nullptr, ThreadRun, td); } } ~HttpServer() {}; private: Socket listensock_; uint16_t port_; }; #endif /* BE0E1813_421A_4BCD_A33B_77432A3CA8D7 */ 

 

——————以上就是本节全部内容哦, 如果对友友们有帮助的话可以关注博主, 方便学习更多知识哦!!!  

Read more

《C/C+++ Boost 轻量级搜索引擎实战:架构流程、技术栈与工程落地指南——构造正/倒排索引(中篇)》

《C/C+++ Boost 轻量级搜索引擎实战:架构流程、技术栈与工程落地指南——构造正/倒排索引(中篇)》

前引:这是一个聚焦基础搜索引擎核心工作流的实操项目,基于 C/C++ 技术生态落地:从全网爬虫抓取网页资源,到服务器端完成 “去标签 - 数据清洗 - 索引构建” 的预处理,再通过 HTTP 服务接收客户端请求、检索索引并拼接结果页返回 —— 完整覆盖了轻量级搜索引擎的端到端逻辑。项目采用 C++11、STL、Boost 等核心技术栈,搭配 CentOS 7 云服务器 + GCC 编译环境(或 VS 系列开发工具)部署,既适配后端工程的性能需求,也能通过可选的前端技术(HTML5/JS 等)优化用户交互,是理解搜索引擎底层原理与 C++ 工程实践的典型案例 目录 【一】Jieba分词工具 【二】正/倒排索引结构设计

By Ne0inhk
【C++指南】类和对象(十):const成员函数

【C++指南】类和对象(十):const成员函数

💓 博客主页:倔强的石头的ZEEKLOG主页             📝Gitee主页:倔强的石头的gitee主页             ⏩ 文章专栏:《C++指南》                                   期待您的关注 目录 引言 一、const成员函数的定义与语法 1. 基本语法 2. 底层原理 二、const成员函数的作用与约束 1. 保障数据安全 2. 与const对象的关系 三、特殊场景与进阶技巧 1. mutable关键字 2. 函数重载 3. 权限传递规则 四、最佳实践与常见误区 1. 编码规范建议 2. 易错点分析 五、总结 引言 在C++中,const成员函数是面向对象编程中保障数据安全性的重要机制。它通过限制函数对类成员的修改权限,提升代码的健壮性和可维护性。 本文将结合代码示例,从语法、原理到实际应用场景,全面解析const成员函数的核心要点。   一、const成员函数的定义与语法

By Ne0inhk

多态(C++)

一、(1)编译时(静态)  函数重载,函数模板 (2)运行时(动态)    重点 二、多态的定义及实现 1.构成条件 多态是一个继承关系下的类对象,去调用同一函数,产生不同的行为 1.1必须重要条件 a.必须是基类(父类)的指针或引用调用函数 b.被调用的函数必须是虚函数 其中基类的virtual可以不写,但是不建议,而且这也是考试的埋坑处 1.2虚函数的重写/覆盖:基类中有一个跟派生类完全相同的虚函数(即返回值类型,函数名字,参数列表(指类型int,char...))也称三同 接下来我们看一道知道答案想给面试官背后来个板砖的题 这里按照常规思路,调用test(),而父子类func构成多态(与参数的值无关,类型相同即可), 那么大部分人都会觉得是A->1,这就调到的出题人的坑里,这就考验大家在平时对于细节的掌握,其实构成多态是形成如下的函数

By Ne0inhk