You cannot select more than 25 topics Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.

365 lines
19 KiB
Markdown

This file contains ambiguous Unicode characters!

This file contains ambiguous Unicode characters that may be confused with others in your current locale. If your use case is intentional and legitimate, you can safely ignore this warning. Use the Escape button to highlight these characters.

# JavaScript类型关于类型有哪些你不知道的细节
你好我是winter。今天我们来讲讲JavaScript的内容在这个部分我首先想跟你聊一聊类型。
JavaScript类型对每个前端程序员来说几乎都是最为熟悉的概念了。但是你真的很了解它们吗我们不妨来看看下面的几个问题。
* 为什么有的编程规范要求用void 0代替undefined
* 字符串有最大长度吗?
* 0.1 + 0.2不是等于0.3么为什么JavaScript里不是这样的
* ES6新加入的Symbol是个什么东西
* 为什么给对象添加的方法能用在基本类型上?
如果你答起来还有些犹豫的地方,这就说明你对这部分知识点,还是有些遗漏之处的。没关系,今天我来帮你一一补上。
我在前面提到过我们的JavaScript模块会从运行时、文法和执行过程三个角度去剖析JS的知识体系本篇我们就从运行时的角度去看JavaScript的类型系统。
> 运行时类型是代码实际执行过程中我们用到的类型。所有的类型数据都会属于7个类型之一。从变量、参数、返回值到表达式中间结果任何JavaScript代码运行过程中产生的数据都具有运行时类型。
## 类型
JavaScript语言的每一个值都属于某一种数据类型。JavaScript语言规定了7种语言类型。语言类型广泛用于变量、函数参数、表达式、函数返回值等场合。根据最新的语言标准这7种语言类型是
1. Undefined
2. Null
3. Boolean
4. String
5. Number
6. Symbol
7. Object。
除了ES6中新加入的Symbol类型剩下6种类型都是我们日常开发中的老朋友了但是要想回答文章一开始的问题我们需要重新认识一下这些老朋友下面我们就来从简单到复杂重新学习一下这些类型。
## Undefined、Null
我们的第一个问题为什么有的编程规范要求用void 0代替undefined现在我们就分别来看一下。
Undefined 类型表示未定义,它的类型只有一个值,就是 undefined。任何变量在赋值前是 Undefined 类型、值为 undefined一般我们可以用全局变量undefined就是名为undefined的这个变量来表达这个值或者 void 运算来把任意一个表达式变成 undefined 值。
但是呢因为JavaScript的代码undefined是一个变量而并非是一个关键字这是JavaScript语言公认的设计失误之一所以我们为了避免无意中被篡改我建议使用 void 0 来获取undefined值。
Undefined跟 Null 有一定的表意差别Null表示的是“定义了但是为空”。所以在实际编程时我们一般不会把变量赋值为 undefined这样可以保证所有值为 undefined 的变量,都是从未赋值的自然状态。
Null 类型也只有一个值,就是 null它的语义表示空值与 undefined 不同null 是 JavaScript 关键字,所以在任何代码中,你都可以放心用 null 关键字来获取 null 值。
## Boolean
Boolean 类型有两个值, true 和 false它用于表示逻辑意义上的真和假同样有关键字 true 和 false 来表示两个值。这个类型很简单,我就不做过多介绍了。
## String
我们来看看字符串是否有最大长度。
String 用于表示文本数据。String 有最大长度是 2^53 - 1这在一般开发中都是够用的但是有趣的是这个所谓最大长度并不完全是你理解中的字符数。
因为String 的意义并非“字符串”,而是字符串的 UTF16 编码,我们字符串的操作 charAt、charCodeAt、length 等方法针对的都是 UTF16 编码。所以,字符串的最大长度,实际上是受字符串的编码长度影响的。
> Note现行的字符集国际标准字符是以 Unicode 的方式表示的,每一个 Unicode 的码点表示一个字符理论上Unicode 的范围是无限的。UTF是Unicode的编码方式规定了码点在计算机中的表示方法常见的有 UTF16 和 UTF8。 Unicode 的码点通常用 U+??? 来表示,其中 ??? 是十六进制的码点值。 0-65536U+0000 - U+FFFF的码点被称为基本字符区域BMP
JavaScript 中的字符串是永远无法变更的,一旦字符串构造出来,无法用任何方式改变字符串的内容,所以字符串具有值类型的特征。
JavaScript 字符串把每个 UTF16 单元当作一个字符来处理所以处理非BMP超出 U+0000 - U+FFFF 范围)的字符时,你应该格外小心。
JavaScript 这个设计继承自 Java最新标准中是这样解释的这样设计是为了“性能和尽可能实现起来简单”。因为现实中很少用到 BMP 之外的字符。
## Number
下面我们来说说Number类型。Number类型表示我们通常意义上的“数字”。这个数字大致对应数学中的有理数当然在计算机中我们有一定的精度限制。
JavaScript中的Number类型有 18437736874454810627(即2^64-2^53+3) 个值。
JavaScript 中的 Number 类型基本符合 IEEE 754-2008 规定的双精度浮点数规则但是JavaScript为了表达几个额外的语言场景比如不让除以0出错而引入了无穷大的概念规定了几个例外情况
* NaN占用了 9007199254740990这原本是符合IEEE规则的数字
* Infinity无穷大
* \-Infinity负无穷大。
另外值得注意的是JavaScript中有 +0 和 -0在加法类运算中它们没有区别但是除法的场合则需要特别留意区分“忘记检测除以-0而得到负无穷大”的情况经常会导致错误而区分 +0 和 -0 的方式,正是检测 1/x 是 Infinity 还是 -Infinity。
根据双精度浮点数的定义Number类型中有效的整数范围是-0x1fffffffffffff至0x1fffffffffffff所以Number无法精确表示此范围外的整数。
同样根据浮点数的定义非整数的Number类型无法用 =====也不行) 来比较一段著名的代码这也正是我们第三题的问题为什么在JavaScript中0.1+0.2不能=0.3
```
console.log( 0.1 + 0.2 == 0.3);
```
这里输出的结果是false说明两边不相等的这是浮点运算的特点也是很多同学疑惑的来源浮点数运算的精度问题导致等式左右的结果并不是严格相等而是相差了个微小的值。
所以实际上这里错误的不是结论而是比较的方法正确的比较方法是使用JavaScript提供的最小精度值
```
console.log( Math.abs(0.1 + 0.2 - 0.3) <= Number.EPSILON);
```
检查等式左右两边差的绝对值是否小于最小精度,才是正确的比较浮点数的方法。这段代码结果就是 true 了。
## Symbol
Symbol 是 ES6 中引入的新类型它是一切非字符串的对象key的集合在ES6规范中整个对象系统被用Symbol 重塑。
在后面的文章中,我会详细叙述 Symbol 跟对象系统。这里我们只介绍Symbol类型本身它有哪些部分它表示什么意思以及如何创建Symbol类型。
Symbol 可以具有字符串类型的描述但是即使描述相同Symbol也不相等。
我们创建 Symbol 的方式是使用全局的 Symbol 函数。例如:
```
var mySymbol = Symbol("my symbol");
```
一些标准中提到的 Symbol可以在全局的 Symbol 函数的属性中找到。例如,我们可以使用 Symbol.iterator 来自定义 for…of 在对象上的行为:
```
var o = new Object
o[Symbol.iterator] = function() {
var v = 0
return {
next: function() {
return { value: v++, done: v > 10 }
}
}
};
for(var v of o)
console.log(v); // 0 1 2 3 ... 9
```
代码中我们定义了iterator之后用for(var v of o)就可以调用这个函数然后我们可以根据函数的行为产生一个for…of的行为。
这里我们给对象o添加了 Symbol.iterator 属性并且按照迭代器的要求定义了一个0到10的迭代器之后我们就可以在for of中愉快地使用这个o对象啦。
这些标准中被称为“众所周知”的 Symbol也构成了语言的一类接口形式。它们允许编写与语言结合更紧密的 API。
## Object
Object 是 JavaScript 中最复杂的类型,也是 JavaScript 的核心机制之一。Object表示对象的意思它是一切有形和无形物体的总称。
下面我们来看一看,为什么给对象添加的方法能用在基本类型上?
在 JavaScript 中对象的定义是“属性的集合”。属性分为数据属性和访问器属性二者都是key-value结构key可以是字符串或者 Symbol类型。
关于对象的机制,后面会有单独的一篇来讲述,这里我重点从类型的角度来介绍对象类型。
提到对象,我们必须要提到一个概念:类。
因为 C++ 和 Java 的成功在这两门语言中每个类都是一个类型二者几乎等同以至于很多人常常会把JavaScript的“类”与类型混淆。
事实上JavaScript 中的“类”仅仅是运行时对象的一个私有属性而JavaScript中是无法自定义类型的。
JavaScript中的几个基本类型都在对象类型中有一个“亲戚”。它们是
* Number
* String
* Boolean
* Symbol。
所以,我们必须认识到 3 与 new Number(3) 是完全不同的值,它们一个是 Number 类型, 一个是对象类型。
Number、String和Boolean三个构造器是两用的当跟 new 搭配时,它们产生对象,当直接调用时,它们表示强制类型转换。
Symbol 函数比较特殊,直接用 new 调用它会抛出错误,但它仍然是 Symbol 对象的构造器。
JavaScript 语言设计上试图模糊对象和基本类型之间的关系,我们日常代码可以把对象的方法在基本类型上使用,比如:
```
console.log("abc".charAt(0)); //a
```
甚至我们在原型上添加方法,都可以应用于基本类型,比如以下代码,在 Symbol 原型上添加了hello方法在任何 Symbol 类型变量都可以调用。
```
Symbol.prototype.hello = () => console.log("hello");
var a = Symbol("a");
console.log(typeof a); //symbola并非对象
a.hello(); //hello有效
```
所以我们文章开头的问题,答案就是`.` 运算符提供了装箱操作,它会根据基础类型构造一个临时对象,使得我们能在基础类型上调用对应对象的方法。
## 类型转换
讲完了基本类型,我们来介绍一个现象:类型转换。
因为JS是弱类型语言所以类型转换发生非常频繁大部分我们熟悉的运算都会先进行类型转换。大部分类型转换符合人类的直觉但是如果我们不去理解类型转换的严格定义很容易造成一些代码中的判断失误。
其中最为臭名昭著的是JavaScript中的“ == ”运算,因为试图实现跨类型的比较,它的规则复杂到几乎没人可以记住。
这里我们当然也不打算讲解==的规则,它属于设计失误,并非语言中有价值的部分,很多实践中推荐禁止使用“ ==”,而要求程序员进行显式地类型转换后,用 === 比较。
其它运算,如加减乘除大于小于,也都会涉及类型转换。幸好的是,实际上大部分类型转换规则是非常简单的,如下表所示:
![](https://static001.geekbang.org/resource/image/71/20/71bafbd2404dc3ffa5ccf5d0ba077720.jpg)
在这个里面较为复杂的部分是Number和String之间的转换以及对象跟基本类型之间的转换。我们分别来看一看这几种转换的规则。
### StringToNumber
字符串到数字的类型转换,存在一个语法结构,类型转换支持十进制、二进制、八进制和十六进制,比如:
* 30
* 0b111
* 0o13
* 0xFF。
此外JavaScript支持的字符串语法还包括正负号科学计数法可以使用大写或者小写的e来表示
* 1e3
* \-1e-2。
需要注意的是parseInt 和 parseFloat 并不使用这个转换,所以支持的语法跟这里不尽相同。
在不传入第二个参数的情况下parseInt只支持16进制前缀“0x”而且会忽略非数字字符也不支持科学计数法。
在一些古老的浏览器环境中parseInt还支持0开头的数字作为8进制前缀这是很多错误的来源。所以在任何环境下都建议传入parseInt的第二个参数而parseFloat则直接把原字符串作为十进制来解析它不会引入任何的其他进制。
多数情况下Number 是比 parseInt 和 parseFloat 更好的选择。
### NumberToString
在较小的范围内数字到字符串的转换是完全符合你直觉的十进制表示。当Number绝对值较大或者较小时字符串表示则是使用科学计数法表示的。这个算法细节繁多我们从感性的角度认识它其实就是保证了产生的字符串不会过长。
具体的算法你可以去参考JavaScript的语言标准。由于这个部分内容我觉得在日常开发中很少用到所以这里我就不去详细地讲解了。
### 装箱转换
每一种基本类型Number、String、Boolean、Symbol在对象中都有对应的类所谓装箱转换正是把基本类型转换为对应的对象它是类型转换中一种相当重要的种类。
前文提到,全局的 Symbol 函数无法使用 new 来调用,但我们仍可以利用装箱机制来得到一个 Symbol 对象我们可以利用一个函数的call方法来强迫产生装箱。
我们定义一个函数函数里面只有return this然后我们调用函数的call方法到一个Symbol类型的值上这样就会产生一个symbolObject。
我们可以用console.log看一下这个东西的type of它的值是object我们使用symbolObject instanceof 可以看到它是Symbol这个类的实例我们找它的constructor也是等于Symbol的所以我们无论从哪个角度看它都是Symbol装箱过的对象
```
var symbolObject = (function(){ return this; }).call(Symbol("a"));
console.log(typeof symbolObject); //object
console.log(symbolObject instanceof Symbol); //true
console.log(symbolObject.constructor == Symbol); //true
```
装箱机制会频繁产生临时对象,在一些对性能要求较高的场景下,我们应该尽量避免对基本类型做装箱转换。
使用内置的 Object 函数我们可以在JavaScript代码中显式调用装箱能力。
```
var symbolObject = Object(Symbol("a"));
console.log(typeof symbolObject); //object
console.log(symbolObject instanceof Symbol); //true
console.log(symbolObject.constructor == Symbol); //true
```
每一类装箱对象皆有私有的 Class 属性,这些属性可以用 Object.prototype.toString 获取:
```
var symbolObject = Object(Symbol("a"));
console.log(Object.prototype.toString.call(symbolObject)); //[object Symbol]
```
在 JavaScript 中,没有任何方法可以更改私有的 Class 属性因此Object.prototype.toString 是可以准确识别对象对应的基本类型的方法,它比 instanceof 更加准确。
但需要注意的是call本身会产生装箱操作所以需要配合 typeof 来区分基本类型还是对象类型。
### 拆箱转换
在JavaScript标准中规定了 ToPrimitive 函数,它是对象类型到基本类型的转换(即,拆箱转换)。
对象到 String 和 Number 的转换都遵循“先拆箱再转换”的规则。通过拆箱转换,把对象变成基本类型,再从基本类型转换为对应的 String 或者 Number。
拆箱转换会尝试调用 valueOf 和 toString 来获得拆箱后的基本类型。如果 valueOf 和 toString 都不存在,或者没有返回基本类型,则会产生类型错误 TypeError。
```
var o = {
valueOf : () => {console.log("valueOf"); return {}},
toString : () => {console.log("toString"); return {}}
}
o * 2
// valueOf
// toString
// TypeError
```
我们定义了一个对象oo有valueOf和toString两个方法这两个方法都返回一个对象然后我们进行o\*2这个运算的时候你会看见先执行了valueOf接下来是toString最后抛出了一个TypeError这就说明了这个拆箱转换失败了。
到 String 的拆箱转换会优先调用 toString。我们把刚才的运算从o\*2换成 String(o),那么你会看到调用顺序就变了。
```
var o = {
valueOf : () => {console.log("valueOf"); return {}},
toString : () => {console.log("toString"); return {}}
}
String(o)
// toString
// valueOf
// TypeError
```
在 ES6 之后,还允许对象通过显式指定 @@toPrimitive Symbol 来覆盖原有的行为。
```
var o = {
valueOf : () => {console.log("valueOf"); return {}},
toString : () => {console.log("toString"); return {}}
}
o[Symbol.toPrimitive] = () => {console.log("toPrimitive"); return "hello"}
console.log(o + "")
// toPrimitive
// hello
```
## 结语
在本篇文章中,我们介绍了 JavaScript 运行时的类型系统。这里回顾一下今天讲解的知识点。
除了这七种语言类型,还有一些语言的实现者更关心的规范类型。
* List 和 Record 用于描述函数传参过程。
* Set主要用于解释字符集等。
* Completion Record用于描述异常、跳出等语句执行过程。
* Reference用于描述对象属性访问、delete等。
* Property Descriptor用于描述对象的属性。
* Lexical Environment 和 Environment Record用于描述变量和作用域。
* Data Block用于描述二进制数据。
有一个说法是:程序 = 算法 + 数据结构,运行时类型包含了所有 JavaScript 执行时所需要的数据结构的定义,所以我们要对它格外重视。
最后我们留一个实践问题如果我们不用原生的Number和parseInt用JavaScript代码实现String到Number的转换该怎么做呢请你把自己的代码留言给我吧
* * *
## 补充阅读
事实上,“类型”在 JavaScript 中是一个有争议的概念。一方面,标准中规定了运行时数据类型; 另一方面JavaScript语言中提供了 typeof 这样的运算,用来返回操作数的类型,但 typeof 的运算结果,与运行时类型的规定有很多不一致的地方。我们可以看下表来对照一下。
![](https://static001.geekbang.org/resource/image/ec/6b/ec4299a73fb84c732efcd360fed6e16b.png)
在表格中多数项是对应的但是请注意object——Null和function——Object是特例我们理解类型的时候需要特别注意这个区别。
从一般语言使用者的角度来看,毫无疑问,我们应该按照 typeof 的结果去理解语言的类型系统。但JavaScript之父本人也在多个场合表示过typeof 的设计是有缺陷的,只是现在已经错过了修正它的时机。
# 猜你喜欢
[![unpreview](https://static001.geekbang.org/resource/image/1a/08/1a49758821bdbdf6f0a8a1dc5bf39f08.jpg)](https://time.geekbang.org/course/intro/163?utm_term=zeusMTA7L&utm_source=app&utm_medium=chongxueqianduan&utm_campaign=163-presell)