You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

13 KiB

加餐4 | 一篇文章,带你快速理解函数式编程

你好,我是月影。今天,我们来讨论函数式编程。

我看到很多同学留言说课程中给出的代码例子有的地方看不明白。我把同学们看不懂的地方汇总了一下发现大部分都是我使用函数式编程来写的。比如我在第7讲说过的 parametric 高阶函数第12讲说过的 traverse 的设计还有第15讲中使用的 toPolar/fromPolar 和改进版的 parametric 设计以及数据篇中的数据处理和D3.js的使用。

如果你还不习惯函数式编程思想,并且也觉得这些代码不容易理解,想知道为什么一定要这么设计,那这节课,你一定要好好听,我会和你系统地说说过程抽象和函数式编程这个话题。

两种编程范式:命令式与声明式

首先我先来说说什么是编程范式。编程范式有两种分别是命令式Imperative和声明式Declarative命令式强调做的步骤也就是怎么做而声明式强调做什么本身以及做的结果。因此编程语言也可以分成命令式和声明式两种类型如果再细分的话命令式又可以分成过程式和面向对象而声明式则可以分成逻辑式和函数式。下面这张图列出了编程语言的分类和每个类型下经典的编程语言。

你注意看这张图里并没有JavaScript。实际上像JavaScript这样的现代脚本语言通常具有混合范式也就是说JavaScript同时拥有命令式和声明式的特征。因此开发者可以同时用JavaScript写出命令式与声明式风格的代码。举个例子我们要遍历一个数组将每一个元素的数值翻倍我们可以分别用命令式和声明式来实现。

首先,是命令式的实现代码:

let list = [1, 2, 3, 4];

let map1 = [];
for(let i = 0; i < list.length; i++){
  map1.push(list[i] * 2);
}

然后是声明式的实现代码:

let list = [1, 2, 3, 4];
const double = x => x * 2;
list.map(double);

从上面的代码我们可以看到虽然两段代码的目的相同但是具体的实现手段差别很大。其中命令式强调怎么做使用的是for循环来遍历而声明式强调做什么用到了double算子。

函数式与纯函数

既然编程风格有命令式和声明式,为什么我们在一些设计中更多会选择声明式风格的函数式编程,它究竟有什么好处呢?通过和前面的代码对比,我们看到似乎声明式(函数式)代码写起来更加简洁。是的,大部分情况下,函数式编程的代码更加简洁。但除了能减少代码量之外,函数式还有什么具体的好处呢?这个就要从纯函数说起了。

我们知道函数是对过程的封装但函数的实现本身可能依赖外部环境或者有副作用Side-effect)。所谓函数的副作用,是指函数执行本身对外部环境的改变。我们把不依赖外部环境和没有副作用的函数叫做纯函数,依赖外部环境或有副作用的函数叫做非纯函数。

这里,我们先来看一组例子:

function add(x, y) {
  return x + y;
}

function getEl(id) {
  return document.getElementById(id);
}

funciton join(arr1, arr2) {
  arr1.push(...arr2);
  return arr1;
}

在上面的代码中add是一个纯函数它的返回结果只依赖于输入的参数与调用的次数、次序、时机等等均无关。而getEl是一个非纯函数它的返回值除了依赖于参数id还和外部环境文档的DOM结构有关。另外join也是一个非纯函数它的副作用是会改变输入参数对象本身的内容所以它的调用次数、次序和时机不同我们得到的结果也不同。

纯函数的优点

现在我们知道了纯函数与非纯函数的区别但我们又为什么要人为地把函数划分为纯函数和非纯函数呢这是因为纯函数与非纯函数相比有三个非常大的优点分别是易于测试上下文无关、可并行计算时序无关、有良好的Bug自限性。下面我一一来解释一下。

首先纯函数易于测试在用单元测试框架的时候因为纯函数不需要依赖外部环境所以我们直接写一个简单的测试case就可以了。

//test with pure functions
test(t => {
  dosth...
  
  done!
});

而非纯函数因为比较依赖外部环境,在测试的时候我们还需要构建外部环境。

//test with impure functions

//always need hooks
test.before(t => {
  //setup environments
});

test.after('cleanup', t => {
  //clean
});

test(t => {
  dosth...
  
  done!
});

其次纯函数可以并行计算。在浏览器中我们可以利用Worker来并行执行多个纯函数在Node.js中我们也可以用Cluster来实现同样的并行执行而使用WebGL的时候纯函数有时候还可以转换为Shader代码利用GPU的特性来进行计算。

最后纯函数有良好的Bug自限性。这是什么意思呢因为纯函数不会依赖和改变外部环境所以它产生的Bug不会扩散到系统的其他部分。而非纯函数尤其是有副作用的非纯函数在产生Bug后因为Bug可能意外改变了外部环境所以问题会扩散到系统其他部分。这样在调试的时候就算发现了Bug你可能也找不到真正导致Bug的原因这就给系统的维护和Bug追踪带来困难。

总而言之,我们设计系统的时候,要尽可能多设计纯函数,少设计非纯函数,这样能够有效提升系统的可测试性、性能优化空间以及系统的可维护性。

函数式编程范式与纯函数

那么问题来了,我们该如何让系统的纯函数尽可能多,非纯函数尽可能少呢?答案是用函数式编程范式。我们还是通过一个例子来理解。

我们要实现一个模块用它来操作DOM中列表元素改变元素的文字颜色具体的实现代码如下

function setColor(el, color){
  el.style.color = color;
}

function setColors(els, color){
  els.forEach(el => setColor(el, color));
}

这个模块中有两个方法其中setColor是操作一个DOM元素改变它的文字颜色而setColors则是批量操作若干个DOM元素改变所有元素的颜色。

尽管这两个方法都非常简单但它们都改变了外部环境DOM所以它们是两个非纯函数。因此我们在做系统测试的时候两个方法都需要构建外部环境来实现测试。

如果想让系统测试更简单我们是不是可以采用函数式编程思想把非纯函数的个数减少一个呢当然可以我们可以实现一个batch函数来优化。batch函数接受的参数是一个函数f就会返回一个新的函数。在这个过程中我们要遵循的调用规则是如果这个参数有length属性我们就以数组来遍历这个参数用每一个元素迭代f否则直接用当前调用参数来调用f就可以了。

具体的实现代码如下:

function batch(fn){
  return function(target, ...args){
    if(target.length >= 0){
      return Array.from(target).map(item => fn.apply(this, [item, ...args]));
    }else{
      return fn.apply(this, [target, ...args]);
    }
  }
}

因为batch函数的参数和返回值都是函数所以它有一个专属的名字高阶函数(High Order Function)。高阶函数虽然看上去复杂,但它实际上就是一个纯函数。它的执行结果只依赖于参数(传入的函数),与外部环境无关。

我们可以测试一下这个batch 函数的正确性方法十分简单只要用下面这个Case就行了。

test(t => {
  let add = (x, y) => x + y;
  let listAdd = batch(add);
  
  t.deepEqual(listAdd([1,2,3], 1), [2,3,4]);
});

有了batch函数之后我们的模块就可以减少为一个非纯函数。

function setColor(el, color){
  el.style.color = color;
}

let setColors = batch(setColor);

这里我们用 batch 来实现 setColors只要 batch 实现正确setColors 的行为就可以保证是正确的。

高阶函数与函数装饰器

刚才我说batch是一个高阶函数。所谓高阶函数是指输入参数是函数或者返回值是函数的函数。

如果输入参数和返回值都是函数,这样的高阶函数又叫做函数装饰器Function Decorators。当一个高阶函数是用来修饰函数本身的,它就是函数装饰器。也就是说,它是在原始函数上增加了某些带有辅助功能的函数。

这么说你可能不太理解,我们再来看一个例子。

假设我们的代码库要进行大版本升级在未来最新的版本中我们想要废弃掉某些API由于很多业务中使用了老版本的库不可能一次升级完因此我们需要做一个平缓过渡。具体来说就是在当前这个版本中先不取消这些旧的API而是给它们增加一个提示信息告诉调用它们的用户这些API将会在下一次升级中被废弃。

如果我们手工修改要废弃的API代码这会是一件非常繁琐的事情。而且我们很容易遗漏或者弄错些什么从而产生不可预料的Bug。

所以,一个比较聪明的办法是,我们实现一个通用的函数装饰器。

function deprecate(fn, oldApi, newApi) {
  const message = `The ${oldApi} is deprecated.
Please use the ${newApi} instead.`;

  return function(...args) {
    console.warn(message);
    return fn.apply(this, args);
  }
}

然后在模块导出API的时候对需要废弃的方法统一应用这个装饰器。

// deprecation.js
// 引入要废弃的 API
import {foo, bar} from './foo';
...
// 用高阶函数修饰
const _foo = deprecate(foo, 'foo', 'newFoo');
const _bar = deprecate(bar, 'bar', 'newBar');


// 重新导出修饰过的API
export {
  foo: _foo,
  bar: _bar,
  ...
}

这样我们就利用函数装饰器无侵入地修改了模块的API将要废弃的模块用deprecate包装之后再输出就实现了我们想要的效果。这里我们实现的deprecate就是一个纯函数它的维护和使用都非常简单。

过程抽象

理解了前面的例子之后咱们再回过头来说说课程中的函数式编程。我们直接来看第7节课里parametric函数的实现。

function parametric(xFunc, yFunc) {
  return function (start, end, seg = 100, ...args) {
    const points = [];
    for(let i = 0; i <= seg; i++) {
      const p = i / seg;
      const t = start * (1 - p) + end * p;
      const x = xFunc(t, ...args); // 计算参数方程组的x
      const y = yFunc(t, ...args);  // 计算参数方程组的y
      points.push([x, y]);
    }
    return {
      draw: draw.bind(null, points),
      points,
    };
  };


如上面代码所示parametric是一个高阶函数它比上面的函数装饰器更加复杂一点的是它的输入是两个函数xFunc和yFunc输出也是一个函数返回的这个函数实际上是一个过程这个过程是对x、y的参数方程根据变量t的值进行采样。

所以实际上parametric函数封装的是一个过程这种封装过程的思路叫做过程抽象。前面的函数装饰器还有batch方法实际上也是过程抽象。对应的一般程序设计中我们不是封装过程而是封装数据所以叫做数据抽象

过程抽象是函数式编程的基础,函数式编程对待函数就像对待数据一样,都会进行封装和抽象,这样能够设计出非常通用的功能模块。

要点总结

函数式编程的内容非常多,这一节课,我只是借助了这些基础的概念和代码,把你带进了函数式编程的大门。

首先我们了解了两种不同的编程范式分别是命令式和声明式。其中函数式属于声明式而过程式和面向对象则属于命令式。JavaScript语言是同时具有命令式和声明式特征的编程语言。

然后,我们知道函数式有一个非常大的优点,就是能够减少非纯函数的数量,这也是我们设计系统时要遵循的原则。因为相比于非纯函数,纯函数具有更好的可测试性、执行效率和可维护性。

最后,我们还学会了使用高阶函数和函数装饰器来设计纯函数,实现通用的功能。这种思路是对过程封装,所以叫做过程抽象,它是函数式编程的基础。

小试牛刀

  1. 如果你了解react你会发现react-hooks其实上就是纯函数设计。你可以思考一下如果引入了它能给你的系统带来什么好处
  2. 我们在前端业务中也会用到一些常用的函数装饰器比如节流throttle和防抖debounce你能说说它们的使用场景吗如果让你实现这两个函数装饰器你又会怎么做呢

函数式编程的思想你都理解了吗?那不妨也把这节课分享给你的朋友吧。今天的内容就到这里了,我们下节课见!