代码重构
在不改变代码外在行为的前提下,对代码进行修改,以改进程序的内部结构
- 如果你要给程序添加一个特性,但发现代码因缺乏良好的结构而不易于进行更改,那就先重构那个程序,使其比较容易添加该特性,然后再添加该特性。
- 重构前,先检查自己是否有一套可靠的测试代码。这些测试必须有自我检验能力。
- 重构技术就是以微小的步伐修改程序。 如果你犯下错误,很容易便可发现它。
重构类型
- 小型重构:在类内部完成,可以借助IDE自动化来进行
- 中型重构:涉及到类之间,要充分做好测试
- 大型重构:对整个系统的架构进行重构优化,需要有计划地进行,时间不短
重构度量
对于中小型重构,可以观察代码健康度相关的指标变化来度量重构的价值:比如代码的圈复杂度、平均函数行数、类行数等
而对于大型重构,则可以通过工程效率上的指标变化来可视化重构的收益
- 需求平均缺陷率:测试中发现的缺陷数除以需求开发时长总和
- 迭代内故事一次性通过率:开发完成后一次性通过验收和测试的需求数除以需求总数
- 版本发布成功率:发布版本时一次性通过验收的次数除以总发布次数
- 端到端交付周期:特性从规划到最终发布的时间间隔的平均值
- 故事平均开发周期:故事停留在开发阶段的时间总和(包括打回后)的平均值
- 缺陷平均解决周期:缺陷从提交到最终修复的时间间隔的平均值
- 故事平均测试周期:故事停留在测试阶段的时间总和(包括打回后)的平均值
- 缺陷/故事的流转次数:需求在进入开发阶段之后到关闭之前转给不同开发的次数
- 技术债务:代码中存在的不符合最佳实践或设计原则的部分
重构原则
为何重构
- 改进软件的设计
- 使代码更容易理解
- 提高编程速度
何时重构
- 预备性重构:添加新功能的时候
- 帮助理解的重构:为了理解系统或者代码所做的工作
- 捡垃圾式重构:偶然发现一处坏代码,重构它
- 修复错误的时候
- 代码审查的时候
何时不该重构
- 不会被用到的代码
- 重构的代价比重写的代价还高的代码
如何保证重构的正确性
测试是保证代码正确性的强有力保证
- 自动化
- 测试不通过真的会失败
- 频繁运行测试
- 注意边界条件
- 使用测试来重现bug
代码的坏味道
- 奇怪的命名
- 重复代码
- 过长的函数
- 过长的参数列表
- 全局数据
- 可变数据
- 发散式变化
- 一个修改会影响到许多地方
- 霰弹式修改
- 一个变化需要修改许多地方
- 过度依赖外部模块
- 类中重复的数据
- 基本类型偏执
- 总觉得基本类型效率更高,不愿使用对象
- 大量重复的switch/if
- 复杂的循环语句
- 冗余的元素
- 一个简单的函数、一个简单的操作
- 过度设计的通用性
- 过度考虑了对象/函数的用途
- 临时字段
- 过长的对象调用
- 没有必要的中间对象
- 两个模块耦合过紧
- 考虑将它们移动到新模块
- 过大的类
- 过度相似的类
- 纯数据类
- 数据和行为没有在一起
- 继承父类,但不提供父类的接口
重构列表
函数/变量
- 提炼函数
根据代码意图进行拆分函数,如果发现一段代码需要阅读一会才能知道是干嘛的,那就提炼它
function printOwing(invoice) {
printBanner();
let outstanding = calculateOutstanding();
//print details
console.log(`name: ${invoice.customer}`);
console.log(`amount: ${outstanding}`);
}
↓
function printOwing(invoice) {
printBanner();
let outstanding = calculateOutstanding();
printDetails(outstanding);
function printDetails(outstanding) {
console.log(`name: ${invoice.customer}`);
console.log(`amount: ${outstanding}`);
}
}
- 内联函数
提炼函数的反向操作
如果函数的代码跟函数名称一样拥有可读性,那么可以直接内联它
- 提炼变量
给一些表达式起个有意义的名称,有助于阅读、调试
return order.quantity * order.itemPrice -
Math.max(0, order.quantity - 500) * order.itemPrice * 0.05 +
Math.min(order.quantity * order.itemPrice * 0.1, 100)
↓
const basePrice = order . quantity * order . itemPrice;
const quantityDiscount = Math. max(0, order . quantity - 500) * order. itemPrice * 0.05;
const shipping = Math. min(basePrice * 0.1, 100);
return basePrice - quantityDiscount + shipping;
- 内联变量
上述的反向重构
有些表达式本身就已经很有语义,没必要引入变量再来说明
- 改变函数签名
注意函数签名的上下文,不同的上下文通用性程度不一样
直接修改
迁移式
- 暴露新旧两个接口,将旧接口设置为废弃
封装变量
对于访问域过大的数据,使用函数进行封装,这样在重构、监控上更加容易
let defaultOwner = {firstName: "Martin", lastName: "Fowler"};
↓
let defaultOwnerData = {firstName: "Martin", lastName: "Fowler"};
export function defaultOwner() {return defaultOwnerData;}
export function setDefaultOwner(arg) {defaultOwnerData = arg;}
- 变量改名
好的命名是整洁代码的核心
- 引入参数对象
让数据项自己的关系变得清晰,并且缩短参数列表
function amountInvoiced(startDate, endDate) {...}
function amountReceived(startDate, endDate) {...}
function amountOverdue(startDate, endDate) {...}
↓
function amountInvoiced(aDateRange) {...}
function amountReceived(aDateRange) {...}
function amountOverdue(aDateRange) {...}
- 函数组合成类
发现行为与数据之间的联系,发现其他的计算逻辑
function base(aReading) {...}
function taxableCharge(aReading) {...}
function calculateBaseCharge(aReading) {...}
↓
class Reading {
base() {...}
taxableCharge() {...}
calculateBaseCharge() {...}
}
- 合并函数
对于多个操作相同的数据,并且逻辑可以集中的函数,可以将它们合并成同一个函数
function base(aReading) {...}
function taxableCharge(aReading) {...}
↓
function enrichReading(argReading) {
const aReading = _.cloneDeep(argReading);
aReading.baseCharge = base(aReading);
aReading.taxableCharge = taxableCharge(aReading);
return aReading;
}
- 拆分阶段
一段代码做了多件事,将它拆分为多个函数
封装
- 封装记录
封装能更好地应对变化
organization = {name: "Acme Gooseberries", country: "GB"};
↓
class Organization {...}
- 封装集合
对集合成员变量进行封装,返回其一个副本,避免其被修改带来的诸多问题
class Person {
get courses() {return this._courses;}
set courses(aList) {this._courses = aList;}
}
↓
class Person {
get courses() {return this._courses.slice();}
addCourse(aCourse) { ... }
removeCourse(aCourse) { ... }
}
- 以对象取代基本类型
一开始使用基本类型能很好地表示,但随着代码演进,这些数据可能会产生一些行为,此时最好将其封装为对象
orders.filter(o => "high" === o.priority
|| "rush" === o.priority);
↓
orders.filter(o => o.priority.higherThan(new Priority("normal")))
- 以查询取代临时变量
使用函数封装临时变量的计算,对于可读性、可复用性有提升
const basePrice = this._quantity * this._itemPrice;
if (basePrice > 1000)
return basePrice * 0.95;
else
return basePrice * 0.98;
↓
get basePrice() {this._quantity * this._itemPrice;}
...
if (this.basePrice > 1000)
return this.basePrice * 0.95;
else
return this.basePrice * 0.98;
- 提炼类
随着代码演进,类不断成长,会变得越加复杂,需要拆分它
class Person {
get officeAreaCode() {return this._officeAreaCode;}
get officeNumber() {return this._officeNumber;}
}
↓
class Person {
get officeAreaCode() {return this._telephoneNumber.areaCode;}
get officeNumber() {return this._telephoneNumber.number;}
}
class TelephoneNumber {
get areaCode() {return this._areaCode;}
get number() {return this._number;}
}
- 内联类
上述的反向操作,由于类职责的改变,或者两个类合并在一起会更加简单
- 隐藏委托关系
封装意味着模块间相互了解的程度应该尽可能小,一旦发生变化,影响也会较小
manager = aPerson.department.manager;
↓
manager = aPerson.manager;
class Person {
get manager() {return this.department.manager;}
}
- 移除中间人
上述的反向操作,对于一些没必要的委托,可以直接让其跟真实对象打交道,避免中间层对象成为一个纯粹的转发对象
- 替换算法
不改变行为的前提下,将比较差的算法替换成比较好的算法
function foundPerson(people) {
for(let i = 0; i < people.length; i++) {
if (people[i] === "Don") {
return "Don";
}
if (people[i] === "John") {
return "John";
}
if (people[i] === "Kent") {
return "Kent";
}
}
return "";
}
↓
function foundPerson(people) {
const candidates = ["Don", "John", "Kent"];
return people.find(p => candidates.includes(p)) || '';
}
搬移特性
- 搬移函数
对于某函数,如果它频繁使用了其他上下文的元素,那么就考虑将它搬移到那个上下文里
class Account {
get overdraftCharge() {...}
}
↓
class AccountType {
get overdraftCharge() {...}
}
- 搬移字段
对于早期设计不良的数据结构,使用此方法改造它
class Customer {
get plan() {return this._plan;}
get discountRate() {return this._discountRate;}
}
↓
class Customer {
get plan() {return this._plan;}
get discountRate() {return this.plan.discountRate;}
}
- 搬移语句到函数
使用这个方法将分散的逻辑聚合到函数里面,方便理解修改
result.push(`<p>title: ${person.photo.title}</p>`);
result.concat(photoData(person.photo));
function photoData(aPhoto) {
return [
`<p>location: ${aPhoto.location}</p>`,
`<p>date: ${aPhoto.date.toDateString()}</p>`,
];
}
↓
result.concat(photoData(person.photo));
function photoData(aPhoto) {
return [
`<p>title: ${aPhoto.title}</p>`,
`<p>location: ${aPhoto.location}</p>`,
`<p>date: ${aPhoto.date.toDateString()}</p>`,
];
}
- 搬移语句到调用者
上述的反向操作
对于代码演进,函数某些代码职责发生变化,将它们移除出去
- 以函数调用取代内联代码
一些函数的函数名就拥有足够的表达能力
let appliesToMass = false;
for(const s of states) {
if (s === "MA") appliesToMass = true;
}
↓
appliesToMass = states.includes("MA");
- 移动语句
让存在关联的东西一起出现,可以使代码更容易理解
const pricingPlan = retrievePricingPlan();
const order = retreiveOrder();
let charge;
const chargePerUnit = pricingPlan.unit;
↓
const pricingPlan = retrievePricingPlan();
const chargePerUnit = pricingPlan.unit;
const order = retreiveOrder();
let charge;
- 拆分循环
对一个循环做了多件事的代码,拆分它,使各段代码职责更加明确
虽然这样可能会对性能造成一些损失
let averageAge = 0;
let totalSalary = 0;
for (const p of people) {
averageAge += p.age;
totalSalary += p.salary;
}
averageAge = averageAge / people.length;
↓
let totalSalary = 0;
for (const p of people) {
totalSalary += p.salary;
}
let averageAge = 0;
for (const p of people) {
averageAge += p.age;
}
averageAge = averageAge / people.length;
- 以管代取代循环
一些逻辑如果采用管道编写,可读性会更强
const names = [];
for (const i of input) {
if (i.job === "programmer")
names.push(i.name);
}
↓
const names = input
.filter(i => i.job === "programmer")
.map(i => i.name);
- 移除死代码
移除那些永远不会允许的代码
重新组织数据
- 拆分变量
如果一个变量被用于多种用途,很明显违反了单一职责原则,这样的代码会造成理解上的困难
let temp = 2 * (height + width);
console.log(temp);
temp = height * width;
console.log(temp);
↓
const perimeter = 2 * (height + width);
console.log(perimeter);
const area = height * width;
console.log(area);
- 字段改名
对于命名不够良好的字段进行改名
- 以查询取代派生变量
使用查询封装变量是消除可变数据的第一步
get discountedTotal() {return this._discountedTotal;}
set discount(aNumber) {
const old = this._discount;
this._discount = aNumber;
this._discountedTotal += old - aNumber;
}
↓
get discountedTotal() {return this._baseTotal - this._discount;}
set discount(aNumber) {this._discount = aNumber;}
- 将引用对象改为值对象
如果非一定需要引用对象,使用值对象不可变的特性能避免很多问题
- 将值对象改为引用对象
如果一个对象需要在多个地方做更新,值对象就不适合了,需要改为引用
简化条件逻辑
- 分解条件表达式
使用函数封装条件逻辑,提升代码的可理解性
if (!aDate.isBefore(plan.summerStart) && !aDate.isAfter(plan.summerEnd))
charge = quantity * plan.summerRate;
else
charge = quantity * plan.regularRate + plan.regularServiceCharge;
↓
if (summer())
charge = summerCharge();
else
charge = regularCharge();
- 合并条件表达式
一些条件的返回值都相等,就将它们封装到同一个函数逻辑里面
if (anEmployee.seniority < 2) return 0;
if (anEmployee.monthsDisabled > 12) return 0;
if (anEmployee.isPartTime) return 0;
↓
if (isNotEligibleForDisability()) return 0;
function isNotEligibleForDisability() {
return ((anEmployee.seniority < 2)
|| (anEmployee.monthsDisabled > 12)
|| (anEmployee.isPartTime));
}
- 以卫语句取代嵌套条件表达式
有时候单一出口原则,似乎不是那么重要
function getPayAmount() {
let result;
if (isDead)
result = deadAmount();
else {
if (isSeparated)
result = separatedAmount();
else {
if (isRetired)
result = retiredAmount();
else
result = normalPayAmount();
}
}
return result;
}
↓
function getPayAmount() {
if (isDead) return deadAmount();
if (isSeparated) return separatedAmount();
if (isRetired) return retiredAmount();
return normalPayAmount();
}
- 以多态取代条件表达式
如果发现一些行为适合用多态取代,试试这样重构它
switch (bird.type) {
case 'EuropeanSwallow':
return "average";
case 'AfricanSwallow':
return (bird.numberOfCoconuts > 2) ? "tired" : "average";
case 'NorwegianBlueParrot':
return (bird.voltage > 100) ? "scorched" : "beautiful";
default:
return "unknown";
↓
class EuropeanSwallow {
get plumage() {
return "average";
}
class AfricanSwallow {
get plumage() {
return (this.numberOfCoconuts > 2) ? "tired" : "average";
}
class NorwegianBlueParrot {
get plumage() {
return (this.voltage > 100) ? "scorched" : "beautiful";
}
- 引入特例
所谓特例,就是满足这个类的行为,但却表达了特例的含义
if (aCustomer === "unknown") customerName = "occupant";
↓
class UnknownCustomer {
get name() {return "occupant";}
- 引入断言
断言提供了一种对系统当前状态的假设,对调试以及阅读很有帮助
if (this.discountRate)
base = base - (this.discountRate * base);
↓
assert(this.discountRate>= 0);
if (this.discountRate)
base = base - (this.discountRate * base);
重构API
- 查询函数和修改函数分离
对于无副作用的函数,有助于测试
function getTotalOutstandingAndSendBill() {
const result = customer.invoices.reduce((total, each) => each.amount + total, 0);
sendBill();
return result;
}
↓
function totalOutstanding() {
return customer.invoices.reduce((total, each) => each.amount + total, 0);
}
function sendBill() {
emailGateway.send(formatBill(customer));
}
- 函数参数化
本质还是消除重复,将函数名字中的参数提取到参数列表中
function tenPercentRaise(aPerson) {
aPerson.salary = aPerson.salary.multiply(1.1);
}
function fivePercentRaise(aPerson) {
aPerson.salary = aPerson.salary.multiply(1.05);
}
↓
function raise(aPerson, factor) {
aPerson.salary = aPerson.salary.multiply(1 + factor);
}
- 移除标记参数
标记参数的存在会增加理解接口调用的难度
function setDimension(name, value) {
if (name === "height") {
this._height = value;
return;
}
if (name === "width") {
this._width = value;
return;
}
}
↓
function setHeight(value) {this._height = value;}
function setWidth (value) {this._width = value;}
- 保持对象完整
传递整个对象能更好地应对未来的变化
const low = aRoom.daysTempRange.low;
const high = aRoom.daysTempRange.high;
if (aPlan.withinRange(low, high))
↓
if (aPlan.withinRange(aRoom.daysTempRange))
- 以查询取代参数
参数列表尽量避免重复,参数列表越短越容易理解
availableVacation(anEmployee, anEmployee.grade);
function availableVacation(anEmployee, grade) {}
↓
availableVacation(anEmployee)
function availableVacation(anEmployee) {}
- 以参数取代查询
上述操作的反向重构,如果不想函数依赖某个元素,那就使用这个方式
- 移除设值函数
取消设值函数,代表着数据不应该被修改的意图
class Person {
get name() {...}
set name(aString) {...}
}
↓
class Person {
get name() {...}
}
- 以工厂函数取代构造函数
构造函数使用起来较不灵活,尝试把创建对象的职责交给工厂
leadEngineer = new Employee(document.leadEngineer, 'E');
↓
leadEngineer = createEngineer(document.leadEngineer);
- 以命名取代函数
命令对象大都服务于单一的函数,命令相交于过程性代码,拥有了大部分面向对象的能力
function score(candidate, medicalExam, scoringGuide) {
let result = 0;
let healthLevel = 0;
// long body code
}
↓
class Scorer {
constructor(candidate, medicalExam, scoringGuide) {
this._candidate = candidate;
this._medicalExam = medicalExam;
this._scoringGuide = scoringGuide;
}
execute() {
this._result = 0;
this._healthLevel = 0;
// long body code
}
}
- 以函数取代命令
上述的反向重构,在不是很复杂的情况下,直接使用函数完成任务即可
处理继承关系
- 函数上移
本质上还是为了避免重复,重复代码是滋生bug的温床
class Employee {...}
class Salesman extends Employee {
get name() {...}
}
class Engineer extends Employee {
get name() {...}
}
↓
class Employee {
get name() {...}
}
class Salesman extends Employee {...}
class Engineer extends Employee {...}
- 字段上移
同上,函数换成字段
- 构造函数本体上移
将子类里的共同行为提取到父类
class Party {...}
class Employee extends Party {
constructor(name, id, monthlyCost) {
super();
this._id = id;
this._name = name;
this._monthlyCost = monthlyCost;
}
}
↓
class Party {
constructor(name){
this._name = name;
}
}
class Employee extends Party {
constructor(name, id, monthlyCost) {
super(name);
this._id = id;
this._monthlyCost = monthlyCost;
}
}
- 函数下移
函数上移的反向重构,如果超类的某个函数只与部分子类有关,那就需要将函数下移
- 字段下移
字段上移的反向重构,动机同上
- 以子类取代类型码
使用多态来替代逻辑判断
function createEmployee(name, type) {
return new Employee(name, type);
}
↓
function createEmployee(name, type) {
switch (type) {
case "engineer": return new Engineer(name);
case "salesman": return new Salesman(name);
case "manager": return new Manager (name);
}
- 移除子类
随着代码演进,子类压根就不需要了
class Person {
get genderCode() {return "X";}
}
class Male extends Person {
get genderCode() {return "M";}
}
class Female extends Person {
get genderCode() {return "F";}
}
↓
class Person {
get genderCode() {return this._genderCode;}
}
- 提炼超类
如果两个类再做相似的事,利用继承机制将它们的相似之处进行提炼
class Department {
get totalAnnualCost() {...}
get name() {...}
get headCount() {...}
}
class Employee {
get annualCost() {...}
get name() {...}
get id() {...}
}
↓
class Party {
get name() {...}
get annualCost() {...}
}
class Department extends Party {
get annualCost() {...}
get headCount() {...}
}
class Employee extends Party {
get annualCost() {...}
get id() {...}
}
- 折叠继承体系
随着继承体系演化,一个类与其超类已经没有多大区别
class Employee {...}
class Salesman extends Employee {...}
↓
class Employee {...}
- 以委托取代子类
继承会给子类带来极大的耦合,父类的任何修改都会影响到子类,使用委托就是一种组合关系,在任何情况下,组合应该优先于继承
class Order {
get daysToShip() {
return this._warehouse.daysToShip;
}
}
class PriorityOrder extends Order {
get daysToShip() {
return this._priorityPlan.daysToShip;
}
}
↓
class Order {
get daysToShip() {
return (this._priorityDelegate)
? this._priorityDelegate.daysToShip
: this._warehouse.daysToShip;
}
}
class PriorityOrderDelegate {
get daysToShip() {
return this._priorityPlan.daysToShip
}
}
- 以委托取代超类
如果父类的一些接口不适合让子类暴露,那么这个类应该就通过组合的方式复用
class List {...}
class Stack extends List {...}
↓
class Stack {
constructor() {
this._storage = new List();
}
}
class List {...}
速查表
坏味道(英文) |
坏味道(中文) |
页码 |
常用重构 |
---|---|---|---|
Alternative Classes with Different Interfaces |
异曲同工的类 |
83 |
改变函数声明(124),搬移函数(198),提炼超类(375) |
Comments |
注释 |
84 |
提炼函数(106),改变函数声明(124),引入断言(302) |
Data Class |
纯数据类 |
83 |
封装记录(162),移除设值函数(331),搬移函数(198),提炼函数(106),拆分阶段(154) |
Data Clumps |
数据泥团 |
78 |
提炼类(182),引入参数对象(140),保持对象完整(319) |
Divergent Change |
发散式变化 |
76 |
拆分阶段(154),搬移函数(198),提炼函数(106),提炼类(182) |
Duplicated Code |
重复代码 |
72 |
提炼函数(106),移动语句(223),函数上移(350) |
Feature Envy |
依恋情结 |
77 |
搬移函数(198),提炼函数(106) |
Global Data |
全局数据 |
74 |
封装变量(132) |
Insider Trading |
内幕交易 |
82 |
搬移函数(198),搬移字段(207),隐藏委托关系(189),以委托取代子类(381),以委托取代超类(399) |
Large Class |
过大的类 |
82 |
提炼类(182),提炼超类(375),以子类取代类型码(362) |
Lazy Element |
冗赘的元素 |
80 |
内联函数(115),内联类(186),折叠继承体系(380) |
Long Function |
过长函数 |
73 |
提炼函数(106),以查询取代临时变量(178),引入参数对象(140),保持对象完整(319),以命令取代函数(337),分解条件表达式(260),以多态取代条件表达式(272),拆分循环(227) |
Long Parameter List |
过长参数列 |
74 |
以查询取代参数(324),保持对象完整(319),引入参数对象(140),移除标记参数(314),函数组合成类(144) |
Loops |
循环语句 |
79 |
以管道取代循环(231) |
Message Chains |
过长的消息链 |
81 |
隐藏委托关系(189),提炼函数(106),搬移函数(198) |
Middle Man |
中间人 |
81 |
移除中间人(192),内联函数(115),以委托取代超类(399),以委托取代子类(381) |
Mutable Data |
可变数据 |
75 |
封装变量(132),拆分变量(240),移动语句(223),提炼函数(106),将查询函数和修改函数分离(306),移除设值函数(331),以查询取代派生变量(248),函数组合成类(144),函数组合成变换(149),将引用对象改为值对象(252) |
Mysterious Name |
神秘命名 |
72 |
改变函数声明(124),变量改名(137),字段改名(244) |
Primitive Obsession |
基本类型偏执 |
78 |
以对象取代基本类型(174),以子类取代类型码(362),以多态取代条件表达式(272),提炼类(182),引入参数对象(140) |
Refused Bequest |
被拒绝的遗赠 |
83 |
函数下移(359),字段下移(361),以委托取代子类(381),以委托取代超类(399) |
Repeated Switches |
重复的switch |
79 |
以多态取代条件表达式(272) |
Shotgun Surgery |
霰弹式修改 |
76 |
搬移函数(198),搬移字段(207),函数组合成类(144),函数组合成变换(149),拆分阶段(154),内联函数(115),内联类(186) |
Speculative Generality |
夸夸其谈通用性 |
80 |
折叠继承体系(380),内联函数(115),内联类(186),改变函数声明(124),移除死代码(237) |
Temporary Field |
临时字段 |
80 |
提炼类(182),搬移函数(198),引入特例(289) |