You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

11 KiB

第32讲 | 如何写出安全的Java代码

在上一讲中我们已经初步接触了Java安全今天我们将一起探讨更多Java开发中可能影响到安全的场合。很多安全问题在特定的上下文存在着不同的定义尽管本质是相似或一致的这是由于Java平台自身的特性所带来特有的问题。今天这一讲我将侧重于Java开发者的角度谈代码安全而不是讲广义的安全风险。

今天我要问你的问题是如何写出安全的Java代码

典型回答

这个问题可能有点宽泛我们可以用特定类型的安全风险为例如拒绝服务DoS攻击分析Java开发者需要重点考虑的点。

DoS是一种常见的网络攻击有人也称其为“洪水攻击”。最常见的表现是利用大量机器发送请求将目标网站的带宽或者其他资源耗尽导致其无法响应正常用户的请求。

我认为从Java语言的角度更加需要重视的是程序级别的攻击也就是利用Java、JVM或应用程序的瑕疵进行低成本的DoS攻击这也是想要写出安全的Java代码所必须考虑的。例如

  • 如果使用的是早期的JDK和Applet等技术攻击者构建合法但恶劣的程序就相对容易例如将其线程优先级设置为最高做一些看起来无害但空耗资源的事情。幸运的是类似技术已经逐步退出历史舞台在JDK 9以后相关模块就已经被移除。

  • 上一讲中提到的哈希碰撞攻击就是个典型的例子对方可以轻易消耗系统有限的CPU和线程资源。从这个角度思考类似加密、解密、图形处理等计算密集型任务都要防范被恶意滥用以免攻击者通过直接调用或者间接触发方式消耗系统资源。

  • 利用Java构建类似上传文件或者其他接受输入的服务需要对消耗系统内存或存储的上限有所控制因为我们不能将系统安全依赖于用户的合理使用。其中特别注意的是涉及解压缩功能时就需要防范Zip bomb等特定攻击。

  • 另外Java程序中需要明确释放的资源有很多种比如文件描述符、数据库连接甚至是再入锁任何情况下都应该保证资源释放成功否则即使平时能够正常运行也可能被攻击者利用而耗尽某类资源这也算是可能的DoS攻击来源。

所以可以看出实现安全的Java代码需要从功能设计到实现细节都充分考虑可能的安全影响。

考点分析

关于今天的问题以典型的DoS攻击作为切入点将问题聚焦在Java开发中我介绍了Java应用设计、实现的注意事项后面还会介绍更加全面的实践。

其实安全问题实际就是软件的缺陷软件安全并不存在一劳永逸的秘籍既离不开设计、架构中的风险分析也离不开编码、测试等阶段的安全实践手段。对于面试官来说考察安全问题除了对特定安全领域知识的考察更多是要看面试者的Java编程基本功和知识的积累。

所以我会在后面会循序渐进探讨Java安全编程这里面没有什么黑科技只有规范的开发标准很多安全问题其实是态度问题取决于你是否真的认真对待它。

  • 我将以一些典型的代码片段为出发点分析一些非常容易被忽略的安全风险并介绍安全问题频发的热点场景如Java序列化和反序列化。

  • 从软件生命周期的角度,探讨设计、开发、测试、部署等不同阶段,有哪些常见的安全策略或工具。

知识扩展

首先,我们一起来看一段不起眼的条件判断代码,这里可能有什么问题吗?

// a, b, c都是int类型的数值
if (a + b < c) {
// …
}

你可能会纳闷,这是再常见不过的一个条件判断了,能有什么安全隐患?

这里的隐患是数值类型需要防范溢出,否则这不仅仅可能会带来逻辑错误,在特定情况下可能导致严重的安全漏洞。

从语言特性来说Java和JVM提供了很多基础性的改进相比于传统的C、C++等语言,对于数组越界等处理要完善的多,原生的避免了缓冲区溢出等攻击方式提高了软件的安全性。但这并不代表完全杜绝了问题Java程序可能调用本地代码也就是JNI技术错误的数值可能导致C/C++层面的数据越界等问题,这是很危险的。

所以,上面的条件判断,需要判断其数值范围,例如,写成类似下面结构。

if (a < c  b)

再来看一个例子,请看下面的一段异常处理代码:

try {
// 业务代码
} catch (Exception e) {
throw new RuntimeException(hostname + port + “ doesnt response”);
}

这段代码将敏感信息包含在异常消息中试想如果是一个Web应用异常也没有良好的包装起来很有可能就把内部信息暴露给终端客户。古人曾经告诫我们“言多必失”是很有道理的虽然其本意不是指软件安全但尽量少暴露信息也是保证安全的基本原则之一。即使我们并不认为某个信息有安全风险我的建议也是如果没有必要不要暴露出来。

这种暴露还可能通过其他方式发生,比如某著名的编程技术网站,就被曝光过所有用户名和密码。这些信息都是明文存储,传输过程也未必进行加密,类似这种情况,暴露只是个时间早晚的问题。

对于安全标准特别高的系统甚至可能要求敏感信息被使用后要立即明确在内存中销毁以免被探测或者避免在发生core dump时意外暴露。

第三Java提供了序列化等创新的特性广泛使用在远程调用等方面但也带来了复杂的安全问题。直到今天序列化仍然是个安全问题频发的场景。

针对序列化,通常建议:

  • 敏感信息不要被序列化在编码中建议使用transient关键字将其保护起来。

  • 反序列化中建议在readObject中实现与对象构件过程相同的安全检查和数据检查。

另外在JDK 9中Java引入了过滤器机制以保证反序列化过程中数据都要经过基本验证才可以使用。其原理是通过黑名单和白名单限定安全或者不安全的类型并且你可以进行定制然后通过环境变量灵活进行配置 更加具体的使用你可以参考 ObjectInputFilter

通过前面的介绍你可能注意到很多安全问题都是源于非常基本的编程细节类似Immutable、封装等设计都存在着安全性的考虑。从实践的角度让每个人都了解和掌握这些原则有必要但并不太现实有没有什么工程实践手段可以帮助我们排查安全隐患呢

开发和测试阶段

在实际开发中各种功能点五花八门未必能考虑的全面。我建议没有必要所有都需要自己去从头实现尽量使用广泛验证过的工具、类库不管是来自于JDK自身还是Apache等第三方组织都在社区的反馈下持续地完善代码安全。

开发过程中应用代码规约标准是避免安全问题的有效手段。我特别推荐来自孤尽的《阿里巴巴Java开发手册》以及其配套工具充分总结了业界在Java等领域的实践经验将规约实践系统性地引入国内的软件开发可以有效提高代码质量。

当然,凡事都是有代价的,规约会增加一定的开发成本,可能对迭代的节奏产生一定影响,所以对于不同阶段、不同需求的团队,可以根据自己的情况对规约进行适应性的调整。

落实到实际开发流程中以OpenJDK团队为例我们应用了几个不同角度的实践

  • 在早期设计阶段,就由安全专家组对新特性进行风险评估。

  • 开发过程中尤其是code review阶段应用OpenJDK自身定制的代码规范。

  • 利用多种静态分析工具如FindBugsParfait等,帮助早期发现潜在安全风险,并对相应问题采取零容忍态度,强制要求解决。

  • 甚至OpenJDK会默认将任何编译等警告都当作错误对待并体现在CI流程中。

  • 在代码check-in等关键环节利用hook机制去调用规则检查工具以保证不合规代码不能进入OpenJDK代码库。

关于静态分析工具的选择,我们选取的原则是“足够好”。没有什么工具能够发现所有问题,所以在保证功能的前提下,影响更大的是分析效率,换句话说是代码分析的噪音高低。不管分析有多么的完备,如果太多误报,就会导致有用信息被噪音覆盖,也不利于后续其他程序化的处理,反倒不利于排查问题。

以上这些是为了保证JDK作为基础平台的苛刻质量要求在实际产品中你需要斟酌具体什么程度的要求是合理的。

部署阶段

JDK自身的也是个软件难免会存在实现瑕疵我们平时看到JDK更新的安全漏洞补丁其实就是在修补这些漏洞。我最近还注意到某大厂后台被曝出了使用的JDK版本存在序列化相关的漏洞。类似这种情况大多数都是因为使用的JDK是较低版本算是可以通过部署解决的问题。

如果是安全敏感型产品建议关注JDK在加解密方面的路线图,同样的标准也应用于其他语言和平台,很多早期认为非常安全的算法,已经被攻破,及时地升级基础软件是安全的必要条件。

攻击和防守是不对称的,只要有一个严重漏洞,对于攻击者就足够了,所以,不能对黑盒形式的部署心存侥幸,这并不能保证系统的安全,攻击者可以利用对软件设计的猜测,结合一系列手段,探测出漏洞。

今天我以DoS等典型攻击方式为例分析了其在Java平台上的特定表现并从更多安全编码的细节帮你体会安全问题的普遍性最后我介绍了软件开发周期中的安全实践希望能对你的工作有所帮助。

一课一练

关于今天我们讨论的题目你做到心中有数了吗你在开发中遇到过Java特定的安全问题吗是怎么解决的呢

请你在留言区写写你对这个问题的思考,我会选出经过认真思考的留言,送给你一份学习奖励礼券,欢迎你与我一起讨论。

别忘了今晚8点半我会做客“极客Live”和你一起聊聊Java面试那些事儿。在“极客时间”App内点击“极客Live”即可加入直播今晚我们不见不散。

你的朋友是不是也在准备面试呢?你可以“请朋友读”,把今天的题目分享给好友,或许你能帮到他。