You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

200 lines
11 KiB
Markdown

2 years ago
# 20 | 总结Tomcat和Jetty中的对象池技术
Java对象特别是一个比较大、比较复杂的Java对象它们的创建、初始化和GC都需要耗费CPU和内存资源为了减少这些开销Tomcat和Jetty都使用了对象池技术。所谓的对象池技术就是说一个Java对象用完之后把它保存起来之后再拿出来重复使用省去了对象创建、初始化和GC的过程。对象池技术是典型的以**空间换时间**的思路。
由于维护对象池本身也需要资源的开销不是所有场景都适合用对象池。如果你的Java对象数量很多并且存在的时间比较短对象本身又比较大比较复杂对象初始化的成本比较高这样的场景就适合用对象池技术。比如Tomcat和Jetty处理HTTP请求的场景就符合这个特征请求的数量很多为了处理单个请求需要创建不少的复杂对象比如Tomcat连接器中SocketWrapper和SocketProcessor而且一般来说请求处理的时间比较短一旦请求处理完毕这些对象就需要被销毁因此这个场景适合对象池技术。
## Tomcat的SynchronizedStack
Tomcat用SynchronizedStack类来实现对象池下面我贴出它的关键代码来帮助你理解。
```
public class SynchronizedStack<T> {
//内部维护一个对象数组,用数组实现栈的功能
private Object[] stack;
//这个方法用来归还对象用synchronized进行线程同步
public synchronized boolean push(T obj) {
index++;
if (index == size) {
if (limit == -1 || size < limit) {
expand();//对象不够用了,扩展对象数组
} else {
index--;
return false;
}
}
stack[index] = obj;
return true;
}
//这个方法用来获取对象
public synchronized T pop() {
if (index == -1) {
return null;
}
T result = (T) stack[index];
stack[index--] = null;
return result;
}
//扩展对象数组长度以2倍大小扩展
private void expand() {
int newSize = size * 2;
if (limit != -1 && newSize > limit) {
newSize = limit;
}
//扩展策略是创建一个数组长度为原来两倍的新数组
Object[] newStack = new Object[newSize];
//将老数组对象引用复制到新数组
System.arraycopy(stack, 0, newStack, 0, size);
//将stack指向新数组老数组可以被GC掉了
stack = newStack;
size = newSize;
}
}
```
这个代码逻辑比较清晰主要是SynchronizedStack内部维护了一个对象数组并且用数组来实现栈的接口push和pop方法这两个方法分别用来归还对象和获取对象。你可能好奇为什么Tomcat使用一个看起来比较简单的SynchronizedStack来做对象容器为什么不使用高级一点的并发容器比如ConcurrentLinkedQueue呢
这是因为SynchronizedStack用数组而不是链表来维护对象可以减少结点维护的内存开销并且它本身只支持扩容不支持缩容也就是说数组对象在使用过程中不会被重新赋值也就不会被GC。这样设计的目的是用最低的内存和GC的代价来实现无界容器同时Tomcat的最大同时请求数是有限制的因此不需要担心对象的数量会无限膨胀。
## Jetty的ByteBufferPool
我们再来看Jetty中的对象池ByteBufferPool它本质是一个ByteBuffer对象池。当Jetty在进行网络数据读写时不需要每次都在JVM堆上分配一块新的Buffer只需在ByteBuffer对象池里拿到一块预先分配好的Buffer这样就避免了频繁的分配内存和释放内存。这种设计你同样可以在高性能通信中间件比如Mina和Netty中看到。ByteBufferPool是一个接口
```
public interface ByteBufferPool
{
public ByteBuffer acquire(int size, boolean direct);
public void release(ByteBuffer buffer);
}
```
接口中的两个方法acquire和release分别用来分配和释放内存并且你可以通过acquire方法的direct参数来指定buffer是从JVM堆上分配还是从本地内存分配。ArrayByteBufferPool是ByteBufferPool的实现类我们先来看看它的成员变量和构造函数
```
public class ArrayByteBufferPool implements ByteBufferPool
{
private final int _min;//最小size的Buffer长度
private final int _maxQueue;//Queue最大长度
//用不同的Bucket(桶)来持有不同size的ByteBuffer对象,同一个桶中的ByteBuffer size是一样的
private final ByteBufferPool.Bucket[] _direct;
private final ByteBufferPool.Bucket[] _indirect;
//ByteBuffer的size增量
private final int _inc;
public ArrayByteBufferPool(int minSize, int increment, int maxSize, int maxQueue)
{
//检查参数值并设置默认值
if (minSize<=0)//ByteBuffer的最小长度
minSize=0;
if (increment<=0)
increment=1024;//默认以1024递增
if (maxSize<=0)
maxSize=64*1024;//ByteBuffer的最大长度默认是64K
//ByteBuffer的最小长度必须小于增量
if (minSize>=increment)
throw new IllegalArgumentException("minSize >= increment");
//最大长度必须是增量的整数倍
if ((maxSize%increment)!=0 || increment>=maxSize)
throw new IllegalArgumentException("increment must be a divisor of maxSize");
_min=minSize;
_inc=increment;
//创建maxSize/increment个桶,包含直接内存的与heap的
_direct=new ByteBufferPool.Bucket[maxSize/increment];
_indirect=new ByteBufferPool.Bucket[maxSize/increment];
_maxQueue=maxQueue;
int size=0;
for (int i=0;i<_direct.length;i++)
{
size+=_inc;
_direct[i]=new ByteBufferPool.Bucket(this,size,_maxQueue);
_indirect[i]=new ByteBufferPool.Bucket(this,size,_maxQueue);
}
}
}
```
从上面的代码我们看到ByteBufferPool是用不同的桶Bucket来管理不同长度的ByteBuffer因为我们可能需要分配一块1024字节的Buffer也可能需要一块64K字节的Buffer。而桶的内部用一个ConcurrentLinkedDeque来放置ByteBuffer对象的引用。
```
private final Deque<ByteBuffer> _queue = new ConcurrentLinkedDeque<>();
```
你可以通过下面的图再来理解一下:
![](https://static001.geekbang.org/resource/image/85/79/852834815eda15e82888ec18a81b5879.png)
而Buffer的分配和释放过程就是找到相应的桶并对桶中的Deque做出队和入队的操作而不是直接向JVM堆申请和释放内存。
```
//分配Buffer
public ByteBuffer acquire(int size, boolean direct)
{
//找到对应的桶,没有的话创建一个桶
ByteBufferPool.Bucket bucket = bucketFor(size,direct);
if (bucket==null)
return newByteBuffer(size,direct);
//这里其实调用了Deque的poll方法
return bucket.acquire(direct);
}
//释放Buffer
public void release(ByteBuffer buffer)
{
if (buffer!=null)
{
//找到对应的桶
ByteBufferPool.Bucket bucket = bucketFor(buffer.capacity(),buffer.isDirect());
//这里调用了Deque的offerFirst方法
if (bucket!=null)
bucket.release(buffer);
}
}
```
## 对象池的思考
对象池作为全局资源,高并发环境中多个线程可能同时需要获取对象池中的对象,因此多个线程在争抢对象时会因为锁竞争而阻塞, 因此使用对象池有线程同步的开销而不使用对象池则有创建和销毁对象的开销。对于对象池本身的设计来说需要尽量做到无锁化比如Jetty就使用了ConcurrentLinkedDeque。如果你的内存足够大可以考虑用**线程本地ThreadLocal对象池**,这样每个线程都有自己的对象池,线程之间互不干扰。
为了防止对象池的无限膨胀,必须要对池的大小做限制。对象池太小发挥不了作用,对象池太大的话可能有空闲对象,这些空闲对象会一直占用内存,造成内存浪费。这里你需要根据实际情况做一个平衡,因此对象池本身除了应该有自动扩容的功能,还需要考虑自动缩容。
所有的池化技术包括缓存都会面临内存泄露的问题原因是对象池或者缓存的本质是一个Java集合类比如List和Stack这个集合类持有缓存对象的引用只要集合类不被GC缓存对象也不会被GC。维持大量的对象也比较占用内存空间所以必要时我们需要主动清理这些对象。以Java的线程池ThreadPoolExecutor为例它提供了allowCoreThreadTimeOut和setKeepAliveTime两种方法可以在超时后销毁线程我们在实际项目中也可以参考这个策略。
另外在使用对象池时,我这里还有一些小贴士供你参考:
* 对象在用完后,需要调用对象池的方法将对象归还给对象池。
* 对象池中的对象在再次使用时需要重置,否则会产生脏对象,脏对象可能持有上次使用的引用,导致内存泄漏等问题,并且如果脏对象下一次使用时没有被清理,程序在运行过程中会发生意想不到的问题。
* 对象一旦归还给对象池,使用者就不能对它做任何操作了。
* 向对象池请求对象时有可能出现的阻塞、异常或者返回null值这些都需要我们做一些额外的处理来确保程序的正常运行。
## 本期精华
Tomcat和Jetty都用到了对象池技术这是因为处理一次HTTP请求的时间比较短但是这个过程中又需要创建大量复杂对象。
对象池技术可以减少频繁创建和销毁对象带来的成本实现对象的缓存和复用。如果你的系统需要频繁的创建和销毁对象并且对象的创建代价比较大这种情况下一般来说你会观察到GC的压力比较大占用CPU率比较高这个时候你就可以考虑使用对象池了。
还有一种情况是你需要对资源的使用做限制,比如数据库连接,不能无限制地创建数据库连接,因此就有了数据库连接池,你也可以考虑把一些关键的资源池化,对它们进行统一管理,防止滥用。
## 课后思考
请你想想在实际工作中,有哪些场景可以用“池化”技术来优化。
不知道今天的内容你消化得如何?如果还有疑问,请大胆的在留言区提问,也欢迎你把你的课后思考和心得记录下来,与我和其他同学一起讨论。如果你觉得今天有所收获,欢迎你把它分享给你的朋友。