@ghimi
2022-05-28T07:35:12.000000Z
字数 3970
阅读 406
未分类
BIO 是最早期的 IO 模型,为==同步阻塞IO==.每次在与用户建立连接请求后会建立一个新的线程来服务该用户请求.这样会导致连接中即使用户没有发送数据,用户连接仍然会占用一个线程进行阻塞服务.从而造成线程资源的浪费.
NIO 在 BIO 的基础上进行了优化,引入了 IO 多路复用的机制,通过新增的模型 Selector
,Buffer
等概念调整了数据监听以及获取的方式,避免了线程阻塞在用户连接上而导致的线程资源浪费.
AIO 在上面两种模型的基础上引入了异步的概念,通过异步编程的方式从架构层面避开了线程资源浪费的问题.
在网络通信中,客户端和服务端通过一个双向的通信连接实现数据的交换,连接的任意一端都可称为一个 Socket。
可以简单描述为这四步:
那 Socket 对象一般包括什么东西呢?一般包括五种信息:连接使用的协议、本地主机的IP地址、本地进程的协议端口、远端主机的IP地址、远端进程的协议端口。从这里可以看到 Socket 包含的信息非常丰富,也就是说拿到一个 Socket 对象就相当于知己知彼了。
// 创建一个ServerSocket,监听端口8888
try (ServerSocket ss = new ServerSocket(8888)) {
// 这里一直会阻塞,直到客户端连接上
Socket socket = ss.accept();
// 输入流用于接收消息
BufferedReader reader = new BufferedReader(new InputStreamReader(socket.getInputStream()));
final PrintStream outputStream = new PrintStream(socket.getOutputStream());
outputStream.print("welcome to milab!\r\n");
while (!socket.isClosed()) {
if (reader.ready()) {
outputStream.print("server received: " + reader.readLine() + "\r\n");
}
}
}
仔细想一下,上面的代码可能会有问题,如果前面一个客户端一直不断开,服务端就不能处理其他客户端的消息了,也就是说程序不具备并发的能力。
我们稍加改造一下,将前面的处理逻辑代码全部抽取到一个新的handle()方法, 每当有客户端连接上就新开一个线程处理:
public static void main(String[] args) throws IOException {
// 创建一个ServerSocket,监听端口8888
try (ServerSocket ss = new ServerSocket(8888)) {
while (true) {
// 这里一直会阻塞,直到客户端连接上
Socket socket = ss.accept();
new Thread(() -> handle(socket)).start();
}
}
}
private static void handle(final Socket socket) {
// 输入流用于接收消息
try (final PrintStream outputStream = new PrintStream(socket.getOutputStream())) {
BufferedReader reader = new BufferedReader(new InputStreamReader(socket.getInputStream()));
outputStream.print("welcome to milab!\r\n");
while (!socket.isClosed()) {
if (reader.ready()) {
outputStream.print("server received: " + reader.readLine() + "\r\n");
}
}
System.out.printf("socket closed %s\r\n", socket);
} catch (IOException e) {
throw new RuntimeException(e);
}
}
看了两段代码,先简单总结一下 BIO 模式的劣势:
综上所述:BIO 模式不能满足大并发业务场景,仅适用于连接数目比较小且固定的架构。
传统 BIO 的特点是只要来了一个新客户端的连接,服务端就会开辟一个线程梳理客户端请求,但是客户端连接后并不是一直都对服务端进行IO操作,这样就会导致服务端阻塞,一直严重线程资源,造成不必要的开销.
Java 1.4 引入 NIO 框架.
同步非阻塞
- 同步:调用的结果会在本次调用后返回,不存在异步线程回调之类的。
- 非阻塞:表现为线程不会一直在等待,把连接加入集合后,线程会一直轮询集合中的连接,有则处理,无则继续接受请求。
IO 是面向流(字节流或者字符流)的,而 NIO 是面向块的,块指的是 Buffer 缓冲区。面向块的方式一次性可以获取或者写入一整块数据,而不需要一个字节一个字节的从流中读取,这样处理数据的速度会比流方式更快。
Buffer 缓冲区的底层实现是数组,根据数组类型可以细分为:ByteBuffer
、CharBuffer
、DoubleBuffer
、FloatBuffer
、IntBuffer
、LongBuffer
、ShortBuffer
等。
Channel 翻译成中文是通道的意思,作用类似于 IO 中的 Stream 流。但是 Channel 和 Stream 不同之处在于 Channel 是双向的,Stream 只是在一个方向移动,而且 Channel 可以用于读、写或者同时用于读写。
常见 Channel 通道类型:
Channel 与 Buffer 之间的关系:
每个 Channel 对应一个 Buffer 缓冲区,永远无法将数据直接写入到Channel或者从Channel中读取数据。需要通过Buffer与Channel交互。
NIO 服务端的实现模式是把多个连接(请求)放入集合中,只用一个线程可以处理多个请求(连接),也就是多路复用,Linux 环境下多路复用底层主要用的是内核函数(select,poll)来实现的,为了提升效率,Java 1.5 版本开始使用 epoll。
在 NIO 中多路复用器我们称之为:Selector,Channel 会注册到 Selector 上,由 Selector 根据 Channel 读写事件的发生将其交由某个空闲的线程处理。
Buffer、Channel、Selector 这三个组件的之间的关系可以用下面的图来描述:
基本的工作流程如下:
(1)首先将 Channel
注册到 ·Selector· 中;
(2)初始化 Selector,调用 select() 方法,select 方法会阻塞直到感兴趣的事件来临;
(3)当某个 Channel 有连接或者读写事件时,该 Channel 就会处于就绪状态;
(4)Selector 开始轮询所有处于就绪状态的SelectionKey,通过 SelectionKey 可以获取对应的Channel 集合;
NIO 相对于 BIO 最大的改进就是使用了多路复用技术,用少量线程处理大量客户端 IO 请求,提高了并发量并减少了资源消耗;
另外NIO 的操作时非阻塞的,比如说,单线程中从通道读取数据到buffer,同时可以继续做别的事情,当数据读取到buffer中后,线程再继续处理数据。写数据也是一样的。
我们来看看 NIO 有哪些问题?
(1)NIO 的 API 使用起来非常麻烦,门槛比较高,开发者需要熟练掌握:Selector、ServerSocketChannel、SocketChannel、ByteBuffer 等类。
(2)NIO 编程涉及到 Reactor 模式,开发者需要对多线程和网络编程非常熟悉才能写出高质量的 NIO 程序;
(3)异常场景处理麻烦,比如:客户端断连重连、网络闪断、拆包粘包、网络拥塞等等;
(4)NIO 有 bug,不稳定,比如:臭名昭著的 Epoll bug,会导致 Selector 空轮询,最终导致 CPU 100%。
NIO 问题这么多,有些开发者终于不能忍了,最终 Netty 框架横空出世。
NIO 概念复杂,开发较为麻烦;
异常场景处理复杂;
存在bug;
异步IO则是采用“订阅-通知”模式: 即应用程序向操作系统注册IO监听,然后继续做自己的事情。当操作系统发生IO事件,并且准备好数据后,在主动通知应用程序,触发相应的函数.