第02章_变量与运算符
第02章_变量与运算符
本章专题与脉络
1. 关键字(keyword)
- 定义:被Java语言赋予了特殊含义,用做专门用途的字符串(或单词)
- HelloWorld案例中,出现的关键字有
class
、public
、static
、void
等,这些单词已经被Java定义好了。
- HelloWorld案例中,出现的关键字有
- 特点:全部关键字都是
小写字母
。 - 关键字比较多,不需要死记硬背,学到哪里记到哪里即可。
- 官方地址: https://docs.oracle.com/javase/tutorial/java/nutsandbolts/_keywords.html
说明:
- 关键字一共
50个
,其中const
和goto
是保留字
(reserved word)。true
,false
,null
不在其中,它们看起来像关键字,其实是字面量,表示特殊的布尔值和空值。
2. 标识符( identifier)
Java中变量、方法、类等要素命名时使用的字符序列,称为标识符。
技巧:凡是自己可以起名字的地方都叫标识符。
标识符的命名规则(必须遵守的硬性规定
):
1 | > 由26个英文字母大小写,0-9 ,_或 $ 组成 |
练习:miles、Test、a++、 –a、4#R、$4、 #44、apps、class、public、int、x、y、radius
标识符的命名规范(建议遵守的软性要求
,否则工作时容易被鄙视):
1 | > 包名:多单词组成时所有字母都小写:xxxyyyzzz。 |
注意:在起名字时,为了提高阅读性,要尽量有意义,“见名知意”。
更多细节详见《代码整洁之道_关于标识符.txt》《阿里巴巴Java开发手册-1.7.1-黄山版》
3. 变量
3.1 为什么需要变量
一花一世界,如果把一个程序看做一个世界或一个社会的话,那么变量就是程序世界的花花草草、万事万物。即,变量是程序中不可或缺的组成单位,最基本的存储单元。
3.2 初识变量
变量的概念:
内存中的一个存储区域,该区域的数据可以在同一类型范围内不断变化
变量的构成包含三个要素:
数据类型
、变量名
、存储的值
Java中变量声明的格式:
数据类型 变量名 = 变量值
变量的作用:用于在内存中保存数据。
使用变量注意:
- Java中每个变量必须先声明,后使用。
- 使用变量名来访问这块区域的数据。
- 变量的作用域:其定义所在的一对{ }内。
- 变量只有在其
作用域
内才有效。出了作用域,变量不可以再被调用。 - 同一个作用域内,不能定义重名的变量。
3.3 Java中变量的数据类型
Java中变量的数据类型分为两大类:
基本数据类型:包括
整数类型
、浮点数类型
、字符类型
、布尔类型
。引用数据类型:包括
数组
、类
、接口
、枚举
、注解
、记录
。
3.4 变量的使用
3.4.1 步骤1:变量的声明
1 | 格式:数据类型 变量名; |
1 | //例如: |
注意:变量的数据类型可以是基本数据类型,也可以是引用数据类型。
3.4.2 步骤2:变量的赋值
给变量赋值,就是把“值”存到该变量代表的内存空间中。同时,给变量赋的值类型必须与变量声明的类型一致或兼容。
变量赋值的语法格式:
1 | 变量名 = 值; |
举例1:可以使用合适类型的常量值
给已经声明的变量赋值
1 | age = 18; |
举例2:可以使用其他变量
或者表达式
给变量赋值
1 | int m = 1; |
3:变量可以反复赋值
1 | //先声明,后初始化 |
举例4:也可以将变量的声明和赋值一并执行
1 | boolean isBeauty = true; |
内存结构如图:
4. 基本数据类型介绍
4.1 整数类型:byte、short、int、long
- Java各整数类型有固定的表数范围和字段长度,不受具体操作系统的影响,以保证Java程序的可移植性。
定义long类型的变量,赋值时需要以”
l
“或”L
“作为后缀。Java程序中变量通常声明为int型,除非不足以表示较大的数,才使用long。
Java的整型
常量默认为 int 型
。
4.1.1 补充:计算机存储单位
字节(Byte):是计算机用于
计量存储容量
的基本
单位,一个字节等于8 bit。位(bit):是数据存储的
最小
单位。二进制数系统中,每个0或1就是一个位,叫做bit(比特),其中8 bit 就称为一个字节(Byte)。转换关系:
- 8 bit = 1 Byte
- 1024 Byte = 1 KB
- 1024 KB = 1 MB
- 1024 MB = 1 GB
- 1024 GB = 1 TB
4.2 浮点类型:float、double
- 与整数类型类似,Java 浮点类型也有固定的表数范围和字段长度,不受具体操作系统的影响。
- 浮点型常量有两种表示形式:
- 十进制数形式。如:5.12 512.0f .512 (必须有小数点)
- 科学计数法形式。如:5.12e2 512E2 100E-2
- float:
单精度
,尾数可以精确到7位有效数字。很多情况下,精度很难满足需求。 - double:
双精度
,精度是float的两倍。通常采用此类型。 - 定义float类型的变量,赋值时需要以”
f
“或”F
“作为后缀。 - Java 的浮点型
常量默认为double型
。
4.2.1 关于浮点型精度的说明
并不是所有的小数都能可以精确的用二进制浮点数表示。二进制浮点数不能精确的表示0.1、0.01、0.001这样10的负次幂。
浮点类型float、double的数据不适合在
不容许舍入误差
的金融计算领域。如果需要精确
数字计算或保留指定位数的精度,需要使用BigDecimal类
。测试用例:
1 | //测试1:(解释见章末企业真题:为什么0.1 + 0.2不等于0.3) |
4.2.2 应用举例
案例1:定义圆周率并赋值为3.14,现有3个圆的半径分别为1.2、2.5、6,求它们的面积。
1 | /** |
案例2:小明要到美国旅游,可是那里的温度是以华氏度为单位记录的。
它需要一个程序将华氏温度(80度)转换为摄氏度,并以华氏度和摄氏度为单位分别显示该温度。
1 | ℃ = (℉ - 32) / 1.8 |
1 | /** |
4.3 字符类型:char
char 型数据用来表示通常意义上“
字符
”(占2字节)Java中的所有字符都使用Unicode编码,故一个字符可以存储一个字母,一个汉字,或其他书面语的一个字符。
字符型变量的三种表现形式:
形式1:使用单引号(‘ ‘)括起来的
单个字符
。例如:char c1 = ‘a’; char c2 = ‘中’; char c3 = ‘9’;
形式2:直接使用
Unicode值
来表示字符型常量:‘\uXXXX
’。其中,XXXX代表一个十六进制整数。例如:\u0023 表示 ‘#’。
形式3:Java中还允许使用
转义字符‘\’
来将其后的字符转变为特殊字符型常量。例如:char c3 = ‘\n’; // ‘\n’表示换行符
转义字符 说明 Unicode表示方式 \n
换行符 \u000a \t
制表符 \u0009 \"
双引号 \u0022 \'
单引号 \u0027 \\
反斜线 \u005c \b
退格符 \u0008 \r
回车符 \u000d char类型是可以进行运算的。因为它都对应有Unicode码,可以看做是一个数值。
4.4 布尔类型:boolean
boolean 类型用来判断逻辑条件,一般用于流程控制语句中:
- if条件控制语句;
- while循环控制语句;
- for循环控制语句;
- do-while循环控制语句;
boolean类型数据只有两个值:true、false,无其它。
- 不可以使用0或非 0 的整数替代false和true,这点和C语言不同。
- 拓展:Java虚拟机中没有任何供boolean值专用的字节码指令,Java语言表达所操作的boolean值,在编译之后都使用java虚拟机中的int数据类型来代替:true用1表示,false用0表示。——《java虚拟机规范 8版》
举例:
1 | boolean isFlag = true; |
经验之谈:
Less is More!建议不要这样写:if ( isFlag = = true ),只有新手才如此。关键也很容易写错成if(isFlag = true),这样就变成赋值isFlag为true而不是判断!
老鸟的写法
是if (isFlag)或者if ( !isFlag)。
5. 基本数据类型变量间运算规则
在Java程序中,不同的基本数据类型(只有7种,不包含boolean类型)变量的值经常需要进行相互转换。
转换的方式有两种:自动类型提升
和强制类型转换
。
5.1 自动类型提升
规则:将取值范围小(或容量小)的类型自动提升为取值范围大(或容量大)的类型 。
基本数据类型的转换规则如图所示:
(1)当把存储范围小的值(常量值、变量的值、表达式计算的结果值)赋值给了存储范围大的变量时
1 | int i = 'A';//char自动升级为int,其实就是把字符的编码值赋值给i变量了 |
(2)当存储范围小的数据类型与存储范围大的数据类型变量一起混合运算时,会按照其中最大的类型运算。
1 | int i = 1; |
(3)当byte,short,char数据类型的变量进行算术运算时,按照int类型处理。
1 | byte b1 = 1; |
练习:
1 | 设 x 为float型变量,y为double型变量,a为int型变量,b为long型变量,c为char型变量,则表达式 |
5.2 强制类型转换
将3.14
赋值到int
类型变量会发生什么?产生编译失败,肯定无法赋值。
1 | int i = 3.14; // 编译报错 |
想要赋值成功,只有通过强制类型转换
,将double
类型强制转换成int
类型才能赋值。
规则:将取值范围大(或容量大)的类型强制转换成取值范围小(或容量小)的类型。
自动类型提升是Java自动执行的,而强制类型转换是自动类型提升的逆运算,需要我们自己手动执行。
转换格式:
1 | 数据类型1 变量名 = (数据类型1)被强转数据值; //()中的数据类型必须<=变量值的数据类型 |
(1)当把存储范围大的值(常量值、变量的值、表达式计算的结果值)强制转换为存储范围小的变量时,可能会损失精度
或溢出
。
1 | int i = (int)3.14;//损失精度 |
(2)当某个值想要提升数据类型时,也可以使用强制类型转换。这种情况的强制类型转换是没有风险
的,通常省略。
1 | int i = 1; |
(3)声明long类型变量时,可以出现省略后缀的情况。float则不同。
1 | long l1 = 123L; |
练习:判断是否能通过编译
1 | 1)short s = 5; |
问答:为什么标识符的声明规则里要求不能数字开头?
1 | //如果允许数字开头,则如下的声明编译就可以通过: |
5.3 基本数据类型与String的运算
5.3.1 字符串类型:String
- String不是基本数据类型,属于引用数据类型
- 使用一对
""
来表示一个字符串,内部可以包含0个、1个或多个字符。 - 声明方式与基本数据类型类似。例如:String str = “尚硅谷”;
5.3.2 运算规则
1、任意八种基本数据类型的数据与String类型只能进行连接“+”运算,且结果一定也是String类型
1 | System.out.println("" + 1 + 2);//12 |
2、String类型不能通过强制类型()转换,转为其他的类型
1 | String str = "123"; |
5.3.3 案例与练习
案例:公安局身份登记
要求填写自己的姓名、年龄、性别、体重、婚姻状况(已婚用true表示,单身用false表示)、联系方式等等。
1 | /** |
练习:
练习1:
1 | String str1 = 4; //判断对错: |
练习2:
1 | System.out.println("* *"); //输出: |
6. 计算机底层如何存储数据
计算机世界中只有二进制,所以计算机中存储和运算的所有数据
都要转为二进制
。包括数字、字符、图片、声音、视频等。
世界上有10种人 ,认识和不认识二进制的。
6.1 进制的分类
十进制(decimal)
- 数字组成:0-9
- 进位规则:满十进一
二进制(binary)
- 数字组成:0-1
- 进位规则:满二进一,以
0b
或0B
开头
八进制(octal):很少使用
- 数字组成:0-7
- 进位规则:满八进一,以数字
0
开头表示
十六进制
- 数字组成:0-9,a-f
- 进位规则:满十六进一,以
0x
或0X
开头表示。此处的 a-f 不区分大小写
代码演示:
1 | class BinaryTest { |
6.2 进制的换算举例
十进制 | 二进制 | 八进制 | 十六进制 |
---|---|---|---|
0 | 0 | 0 | 0 |
1 | 1 | 1 | 1 |
2 | 10 | 2 | 2 |
3 | 11 | 3 | 3 |
4 | 100 | 4 | 4 |
5 | 101 | 5 | 5 |
6 | 110 | 6 | 6 |
7 | 111 | 7 | 7 |
8 | 1000 | 10 | 8 |
9 | 1001 | 11 | 9 |
10 | 1010 | 12 | a或A |
11 | 1011 | 13 | b或B |
12 | 1100 | 14 | c或C |
13 | 1101 | 15 | d或D |
14 | 1110 | 16 | e或E |
15 | 1111 | 17 | f或F |
16 | 10000 | 20 | 10 |
6.3 二进制的由来
二进制,是计算技术中广泛采用的一种数制,由德国数理哲学大师莱布尼茨
于1679年发明。
二进制数据是用0和1两个数码来表示的数。它的基数为2,进位规则是“逢二进一
”。
二进制广泛应用于我们生活的方方面面。比如,广泛使用的摩尔斯电码(Morse Code),它由两种基本信号组成:短促的点信号“·
”,读“滴
”;保持一定时间的长信号“—
”,读“嗒
”。然后,组成了26个字母,从而拼写出相应的单词。
记忆技巧:
我们偶尔会看到的:SOS,即为:
6.4 二进制转十进制
二进制如何表示整数?
计算机数据的存储使用二进制
补码
形式存储,并且最高位是符号位
。- 正数:
最高位是0
- 负数:
最高位是1
- 正数:
规 定
- 正数的补码与反码、原码一样,称为
三码合一
- 负数的补码与反码、原码不一样:
- 负数的
原码
:把十进制转为二进制,然后最高位设置为1 - 负数的
反码
:在原码的基础上,最高位不变,其余位取反(0变1,1变0) - 负数的
补码
:反码+1
- 负数的
- 正数的补码与反码、原码一样,称为
二进制转十进制:权相加法
针对于byte数据举例来说:
例如:byte类型(1个字节,8位)
25 ==> 原码 0001 1001 ==> 反码 0001 1001 –>补码 0001 1001
-25 ==>原码 1001 1001 ==> 反码1110 0110 ==>补码 1110 0111
1 | 整数: |
一个字节可以存储的整数范围是多少?
1 | //1个字节:8位 |
6.5 十进制转二进制
十进制转二进制:除2取余的逆
6.6 二进制与八进制、十六进制间的转换
二进制转八进制
二进制转十六进制
八进制、十六进制转二进制
6.7 各进制间的转换
练习:
1 | 1.将以下十进制数转换为十六进制和二进制 |
7. 运算符(Operator)(掌握)
运算符是一种特殊的符号,用以表示数据的运算、赋值和比较等。
运算符的分类:
- 按照
功能
分为:算术运算符、赋值运算符、比较(或关系)运算符、逻辑运算符、位运算符、条件运算符、Lambda运算符
分类 | 运算符 |
---|---|
算术运算符(7个) | +、-、*、/、%、++、– |
赋值运算符(12个) | =、+=、-=、*=、/=、%=、>>=、<<=、>>>=、&=、|=、^=等 |
比较(或关系)运算符(6个) | >、>=、<、<=、==、!= |
逻辑运算符(6个) | &、|、^、!、&&、|| |
位运算符(7个) | &、|、^、~、<<、>>、>>> |
条件运算符(1个) | (条件表达式)?结果1:结果2 |
Lambda运算符(1个) | ->(第18章时讲解) |
- 按照
操作数个数
分为:一元运算符(单目运算符)、二元运算符(双目运算符)、三元运算符 (三目运算符)
分类 | 运算符 |
---|---|
一元运算符(单目运算符) | 正号(+)、负号(-)、++、–、!、~ |
二元运算符(双目运算符) | 除了一元和三元运算符剩下的都是二元运算符 |
三元运算符 (三目运算符) | (条件表达式)?结果1:结果2 |
7.1 算术运算符
7.1.1 基本语法
举例1:加减乘除模
1 | public class ArithmeticTest1 { |
举例2:“+”号的两种用法
- 第一种:对于
+
两边都是数值的话,+
就是加法的意思 - 第二种:对于
+
两边至少有一边是字符串的话,+
就是拼接的意思
1 | public class ArithmeticTest2 { |
举例3:自加自减运算
理解:++
运算,表示自增1
。同理,--
运算,表示自减1
,用法与++ 一致。
1、单独使用
- 变量在单独运算的时候,变量
前++
和变量后++
,是没有区别的。 - 变量
前++
:例如++a
。 - 变量
后++
:例如a++
。
1 | public class ArithmeticTest3 { |
2、复合使用
- 和
其他变量放在一起使用
或者和输出语句放在一起使用
,前++
和后++
就产生了不同。
- 变量
前++
:变量先自增1,然后再运算。 - 变量
后++
:变量先运算,然后再自增1。
1 | public class ArithmeticTest4 { |
7.1.2 案例与练习
案例1:
1 | 随意给出一个整数,打印显示它的个位数,十位数,百位数的值。 |
1 | /** |
拓展:获取一个四位数的个位,十位,百位,千位
1 | /** |
案例2:为抵抗洪水,战士连续作战89小时,编程计算共多少天零多少小时?
1 | /** |
练习1:算术运算符:自加、自减
1 | public class ArithmeticExer3{ |
练习2:
1 | System.out.println("5+5=" + 5 + 5); //打印结果是? 5+5=55 ? |
练习3:
1 | byte bb1 = 127; |
练习4:
1 | int i = 1; |
练习5:(企业真题)写出下列程序的输出结果
1 | int i = 2; |
7.2 赋值运算符
7.2.1 基本语法
符号:=
- 当“=”两侧数据类型不一致时,可以使用自动类型转换或使用强制类型转换原则进行处理。
- 支持
连续赋值
。
扩展赋值运算符: +=、 -=、*=、 /=、%=
赋值运算符 符号解释 +=
将符号 左边的值
和右边的值
进行相加
操作,最后将结果赋值给左边的变量
-=
将符号 左边的值
和右边的值
进行相减
操作,最后将结果赋值给左边的变量
*=
将符号 左边的值
和右边的值
进行相乘
操作,最后将结果赋值给左边的变量
/=
将符号 左边的值
和右边的值
进行相除
操作,最后将结果赋值给左边的变量
%=
将符号 左边的值
和右边的值
进行取余
操作,最后将结果赋值给左边的变量
1 | public class SetValueTest1 { |
7.2.2 练习
练习1:
1 | short s = 3; |
练习2:
1 | int i = 1; |
练习3:
1 | int m = 2; |
练习4:
1 | int n = 10; |
练习5:你有几种办法实现变量值减1?变量值减2呢?
1 | /** |
7.3 比较(关系)运算符
比较运算符的结果都是boolean型,也就是要么是true,要么是false。
> < >= <= :只适用于基本数据类型(除boolean类型之外)
== != :适用于基本数据类型和引用数据类型
比较运算符“
==
”不能误写成“=
”
举例:
1 | class CompareTest { |
思考:
1 | boolean b1 = false; |
7.4 逻辑运算符
7.4.1 基本语法
逻辑运算符,操作的都是boolean类型的变量或常量,而且运算得结果也是boolean类型的值。
运算符说明:
- & 和 &&:表示”且”关系,当符号左右两边布尔值都是true时,结果才能为true。否则,为false。
- | 和 || :表示”或”关系,当符号两边布尔值有一边为true时,结果为true。当两边都为false时,结果为false
- ! :表示”非”关系,当变量布尔值为true时,结果为false。当变量布尔值为false时,结果为true。
- ^ :当符号左右两边布尔值不同时,结果为true。当两边布尔值相同时,结果为false。
- 理解:
异或,追求的是“异”!
- 理解:
逻辑运算符用于连接布尔型表达式,在Java中不可以写成 3 < x < 6,应该写成x > 3 & x < 6 。
区分“&”和“&&”:
相同点:如果符号左边是true,则二者都执行符号右边的操作
不同点:& : 如果符号左边是false,则继续执行符号右边的操作
&& :如果符号左边是false,则不再继续执行符号右边的操作
- 建议:开发中,推荐使用 &&
区分“|”和“||”:
相同点:如果符号左边是false,则二者都执行符号右边的操作
不同点:| : 如果符号左边是true,则继续执行符号右边的操作
|| :如果符号左边是true,则不再继续执行符号右边的操作
建议:开发中,推荐使用 ||
代码举例:
1 | public class LoginTest { |
7.4.2 案例与练习
案例:
1 | 1. 定义类 CompareLogicExer |
1 | /** |
练习1:区分 & 和 &&
1 | int x = 1; |
1 | int x = 1,y = 1; |
练习2:区分 | 和 ||
1 | int x = 1,y = 1; |
1 | int x = 1,y = 1; |
练习3:程序输出
1 | class Test { |
1 | //结果为: |
7.5 位运算符(难点、非重点)
7.5.1 基本语法
- 位运算符的运算过程都是基于二进制的补码运算
(1)左移:<<
运算规则:在一定范围内,数据每向左移动一位,相当于原数据*2。(正数、负数都适用)
【注意】当左移的位数n超过该数据类型的总位数时,相当于左移(n-总位数)位
1 | 3<<4 类似于 3*2的4次幂 => 3*16 => 48 |
1 | -3<<4 类似于 -3*2的4次幂 => -3*16 => -48 |
(2)右移:>>
运算规则:在一定范围内,数据每向右移动一位,相当于原数据/2。(正数、负数都适用)
【注意】如果不能整除,向下取整
。
1 | 69>>4 类似于 69/2的4次 = 69/16 =4 |
1 | -69>>4 类似于 -69/2的4次 = -69/16 = -5 |
(3)无符号右移:>>>
运算规则:往右移动后,左边空出来的位直接补0。(正数、负数都适用)
1 | 69>>>4 类似于 69/2的4次 = 69/16 =4 |
1 | -69>>>4 结果:268435451 |
(4)按位与:&
运算规则:对应位都是1才为1,否则为0。
1 & 1 结果为1
1 & 0 结果为0
0 & 1 结果为0
0 & 0 结果为0
1 | 9 & 7 = 1 |
1 | -9 & 7 = 7 |
(5)按位或:|
运算规则:对应位只要有1即为1,否则为0。
1 | 1 结果为1
1 | 0 结果为1
0 | 1 结果为1
0 & 0 结果为0
1 | 9 | 7 //结果: 15 |
1 | -9 | 7 //结果: -9 |
(6)按位异或:^
运算规则:对应位一个为1一个为0,才为1,否则为0。
1 ^ 1 结果为0
1 ^ 0 结果为1
0 ^ 1 结果为1
0 ^ 0 结果为0
1 | 9 ^ 7 //结果为14 |
1 | -9 ^ 7 //结果为-16 |
(7)按位取反:~
运算规则:对应位为1,则结果为0;对应位为0,则结果为1。
~0就是1
~1就是0
1 | ~9 //结果:-10 |
1 | ~-9 //结果:8 |
7.5.2 举例
举例1:
举例2:体会 m = k ^ n = (m ^ n) ^ n
7.5.3 案例
案例1:高效的方式计算2 * 8的值(经典面试题)
1 | 答案:2 << 3 、 8 << 1 |
案例2:如何交换两个int型变量的值?String呢?
1 | /** |
7.6 条件运算符
7.6.1 基本语法
- 条件运算符格式:
1 | (条件表达式)? 表达式1:表达式2 |
说明:条件表达式是boolean类型的结果,根据boolean的值选择表达式1或表达式2
如果运算后的结果赋给新的变量,要求表达式1和表达式2为同种或兼容的类型
1 | public static void main(String[] args) { |
7.6.2 案例
案例1:获取两个数中的较大值
1 | /** |
案例2:获取三个数中的最大值
1 | /** |
案例3:今天是周2,10天以后是周几?
要求:控制台输出”今天是周2,10天以后是周x”。
1 | /** |
7.6.3 与if-else的转换关系
凡是可以使用条件运算符的地方,都可以改写为if-else结构。反之,不成立。
开发中,如果既可以使用条件运算符,又可以使用if-else,推荐使用条件运算符。因为执行效率稍高。
1 | //if-else实现获取两个数的较大值 |
7.7 运算符优先级
运算符有不同的优先级,所谓优先级就是在表达式运算中的运算符顺序。
上一行中的运算符总是优先于下一行的。
优先级 | 运算符说明 | Java运算符 |
---|---|---|
1 | 括号 | () 、[] 、{} |
2 | 正负号 | + 、- |
3 | 单元运算符 | ++ 、-- 、~ 、! |
4 | 乘法、除法、求余 | * 、/ 、% |
5 | 加法、减法 | + 、- |
6 | 移位运算符 | << 、>> 、>>> |
7 | 关系运算符 | < 、<= 、>= 、> 、instanceof |
8 | 等价运算符 | == 、!= |
9 | 按位与 | & |
10 | 按位异或 | ^ |
11 | 按位或 | ` |
12 | 条件与 | && |
13 | 条件或 | ` |
14 | 三元运算符 | ? : |
15 | 赋值运算符 | = 、+= 、-= 、*= 、/= 、%= |
16 | 位赋值运算符 | &= 、` |
开发建议:
- 不要过多的依赖运算的优先级来控制表达式的执行顺序,这样可读性太差,尽量
使用()来控制
表达式的执行顺序。- 不要把一个表达式写得过于复杂,如果一个表达式过于复杂,则把它
分成几步
来完成。例如:
(num1 + num2) * 2 > num3 && num2 > num3 ? num3 : num1 + num2;
8. 【拓展】关于字符集
8.1 字符集
- 编码与解码
计算机中储存的信息都是用二进制数
表示的,而我们在屏幕上看到的数字、英文、标点符号、汉字等字符是二进制数转换之后的结果。按照某种规则,将字符存储到计算机中,称为编码
。反之,将存储在计算机中的二进制数按照某种规则解析显示出来,称为解码
。
字符编码(Character Encoding) : 就是一套自然语言的字符与二进制数之间的对应规则。
字符集:也叫编码表。是一个系统支持的所有字符的集合,包括各国家文字、标点符号、图形符号、数字等。
8.2 ASCII码
- ASCII码(American Standard Code for Information Interchange,美国信息交换标准代码):上个世纪60年代,美国制定了一套字符编码,对
英语字符
与二进制位之间的关系,做了统一规定。这被称为ASCII码。 - ASCII码用于显示现代英语,主要包括控制字符(回车键、退格、换行键等)和可显示字符(英文大小写字符、阿拉伯数字和西文符号)。
- 基本的ASCII字符集,使用7位(bits)表示一个字符(最前面的1位统一规定为0),共
128个
字符。比如:空格“SPACE”是32(二进制00100000),大写的字母A是65(二进制01000001)。 - 缺点:不能表示所有字符。
8.3 ISO-8859-1字符集
- 拉丁码表,别名Latin-1,用于显示欧洲使用的语言,包括荷兰语、德语、意大利语、葡萄牙语等
- ISO-8859-1使用单字节编码,兼容ASCII编码。
8.4 GBxxx字符集
- GB就是国标的意思,是为了
显示中文
而设计的一套字符集。 - GB2312:简体中文码表。一个小于127的字符的意义与原来相同,即向下兼容ASCII码。但两个大于127的字符连在一起时,就表示一个汉字,这样大约可以组合了包含
7000多个简体汉字
,此外数学符号、罗马希腊的字母、日文的假名们都编进去了,这就是常说的”全角”字符,而原来在127号以下的那些符号就叫”半角”字符了。 - GBK:最常用的中文码表。是在GB2312标准基础上的扩展规范,使用了
双字节
编码方案,共收录了21003个
汉字,完全兼容GB2312标准,同时支持繁体汉字
以及日韩汉字等。 - GB18030:最新的中文码表。收录汉字
70244个
,采用多字节
编码,每个字可以由1个、2个或4个字节组成。支持中国国内少数民族的文字,同时支持繁体汉字以及日韩汉字等。
8.5 Unicode码
Unicode编码为表达
任意语言的任意字符
而设计,也称为统一码、标准万国码。Unicode 将世界上所有的文字用2个字节
统一进行编码,为每个字符设定唯一的二进制编码,以满足跨语言、跨平台进行文本处理的要求。Unicode 的缺点:这里有三个问题:
- 第一,英文字母只用一个字节表示就够了,如果用更多的字节存储是
极大的浪费
。 - 第二,如何才能
区别Unicode和ASCII
?计算机怎么知道两个字节表示一个符号,而不是分别表示两个符号呢? - 第三,如果和GBK等双字节编码方式一样,用最高位是1或0表示两个字节和一个字节,就少了很多值无法用于表示字符,
不够表示所有字符
。
- 第一,英文字母只用一个字节表示就够了,如果用更多的字节存储是
Unicode在很长一段时间内无法推广,直到互联网的出现,为解决Unicode如何在网络上传输的问题,于是面向传输的众多 UTF(UCS Transfer Format)标准出现。具体来说,有三种编码方案,UTF-8、UTF-16和UTF-32。
8.6 UTF-8
- Unicode是字符集,UTF-8、UTF-16、UTF-32是三种
将数字转换到程序数据
的编码方案。顾名思义,UTF-8就是每次8个位传输数据,而UTF-16就是每次16个位。其中,UTF-8 是在互联网上使用最广
的一种 Unicode 的实现方式。 - 互联网工程工作小组(IETF)要求所有互联网协议都必须支持UTF-8编码。所以,我们开发Web应用,也要使用UTF-8编码。UTF-8 是一种
变长的编码方式
。它可以使用 1-4 个字节表示一个符号它使用一至四个字节为每个字符编码,编码规则:- 128个US-ASCII字符,只需一个字节编码。
- 拉丁文等字符,需要二个字节编码。
- 大部分常用字(含中文),使用三个字节编码。
- 其他极少使用的Unicode辅助字符,使用四字节编码。
- 举例
Unicode符号范围 | UTF-8编码方式
1 | (十六进制) | (二进制) |
8.7 小结
注意:在中文操作系统上,ANSI(美国国家标准学会、AMERICAN NATIONAL STANDARDS INSTITUTE: ANSI)编码即为GBK;在英文操作系统上,ANSI编码即为ISO-8859-1。