浏览器中捕获和分析javascript错误捕获经

时间：2015-09-04 编辑：简简单单来源：一聚教程网

对于javascript的出错，例如xxx undefined,SyntaxError等，我们是再熟悉不过的了，本文我们来讨论关于javascript出错如何捕获。

我们team将出现错误的javascript代码取名为badjs，也有一个开源的badjs项目，用于捕获和分析js错误，并提供了一些基础的报表数据分析。

捕获错误一般有两种方式：

    使用window.onerror()捕获全局的js错误信息
    使用try{...}catch(e){...}包裹需要执行的代码，获取error对象的属性定位错误并上报

第一种方式最简单，但当执行的js代码和我们的站点在不同域即跨域时，由于浏览器的安全限制，onerror()方法只能捕获到一个固定的错误代码Script error.。具体可参考这里：点击查看

我们团队目前的业务基本都会将静态资源部署到cdn服务器，和站点处于不同域，所以需要解决跨域问题。

跨域问题可以通过服务器端设置access-control-allow-orgin:*解决，但并不完美。这个问题更深入的信息可以参考这里：https://github.com/BetterJS/badjs-report/issues/3

第二种方式是手动包裹一些要检测的代码，没有跨域问题并且可以获取到err的对象的详细出错信息。这种方式相对麻烦一些，但可以通过全局的hook，处理大部分情况，免除每次手动写try...catch的烦恼。

我们都知道js代码的执行是通过事件和定时器触发执行的，所以理论上将事件触发时的回调、定时器的回调包裹即可。

我们的badjs项目主要是通过第二种方式实现，并根据现有的业务，对以下几种方法进行了处理：

    define(),require()等方法
    jQuery封装的一些事件，如$.event.add,$.event.remove,ajax等
    setTimeout setInterval等

这里处理的原理比较简单，类似下面的代码：

function define(){
    ...
}
var a = define;
define = function(){
    try{
        a.apply(this,arguments);
    }catch(e){
        ...错误上报
    }
};

这里还有一些兼容性的问题需要处理，例如在ie低版本中setTimtout和setInterval方法并不是function类型，而是object，所以无法使用改写function的方式进行包裹。类似的还有document.attachEvent方法也是object，不是function。

除了对以上方法的单独处理外，还有一些意外情况无法处理，例如：

    window.onload,Image.prototype.onerror等浏览器和dom的事件,这类方法无法直接改写function
    第三方的插件的自定义事件，如flash播放器提供的一些用于播放控制的事件。
    新的一些api，如FileReader.prototype.onload等

这些意外情况很难做全局的hook，所以只好手动try...catch。我们的badjs也提供了一个便捷的api，例如源代码是这样：

var img = new Image();
img.onload = function(){
    ...
};

使用tryjs包裹

var img = new Image();
img.onload = tryJs.spyCustom(function(){
    ...
});

除此之外，try...catch能获取的err对象在各不同的浏览器之间，也有一些差异。好在有人已经做一个页面展示详细的差异，参考url: http://broofa.com/tests/ErrorProperties.htm。
一些其他的补充

回到捕获js错误这件事本身，是为了更好的监控并定位错误，帮助我们改善代码质量，所以kael也提到另外一个思路，可以灰度一部分用户，直接使用主域而不是cdn的js，直接避免跨域问题，这个思路也值得一试。

另外，错误上报数据和访问量等数据如果到结合一起分析，不仅可以更快速的定位问题，甚至可以实现监控自动告警等，当然这个也非常复杂。

如何在浏览器中捕获和分析JavaScript Error

前端工程师都知道 JavaScript 有基本的异常处理能力。我们可以 throw new Error()，浏览器也会在我们调用 API 出错时抛出异常。但估计绝大多数前端工程师都没考虑过收集这些异常信息。反正只要 JavaScript 出错后刷新不复现，那用户就可以通过刷新解决问题，浏览器不会崩溃，当没有发生过好了。这种假设在 Single Page App 流行之前还是成立的。现在的 Single Page App 运行一段时间后状态复杂无比，用户可能进行了若干输入操作才来到这里的，说刷新就刷新啊？之前的操作岂不要完全重做？所以我们还是有必要捕获和分析这些异常信息的，然后我们就可以修改代码避免影响用户体验。

捕获异常的方式

我们自己写的 throw new Error() 想要捕获当然可以捕获，因为我们很清楚 throw 写在哪里了。但是调用浏览器 API 时发生的异常就不一定那么容易捕获了，有些 API 在标准里就写着会抛出异常，有些 API 只有个别浏览器因为实现差异或者有缺陷而抛出异常。对于前者我们还能通过 try-catch 捕获，对于后者我们必须监听全局的异常然后捕获。

try-catch

如果有些浏览器 API 是已知会抛出异常的，那我们就需要把调用放到 try-catch 里面，避免因为出错而导致整个程序进入非法状态。例如说 window.localStorage 就是这样的一个 API，在写入数据超过容量限制后就会抛出异常，在 Safari 的隐私浏览模式下也会如此。

try {
localStorage.setItem('date', Date.now());
} catch (error) {
reportError(error);
}

另一个常见的 try-catch 适用场景是回调。因为回调函数的代码是我们不可控的，代码质量如何，会不会调用其它会抛出异常的 API，我们一概不知道。为了不要因为回调出错而导致调用回调后的其它代码无法执行，所以把调用回到放到 try-catch 里面是必须的。

listeners.forEach(function(listener) {
try {
    listener();
} catch (error) {
    reportError(error);
}
});

window.onerror

对于 try-catch 覆盖不到的地方，如果出现异常就只能通过 window.onerror 来捕获了。

window.onerror =
function(errorMessage, scriptURI, lineNumber) {
    reportError({
      message: errorMessage,
      script: scriptURI,
      line: lineNumber
    });
}

注意不要耍小聪明使用 window.addEventListener 或 window.attachEvent 的形式去监听 window.onerror。很多浏览器只实现了 window.onerror，或者是只有window.onerror 的实现是标准的。考虑到标准草案定义的也是 window.onerror，我们使用 window.onerror 就好了。

属性丢失

假设我们有一个 reportError 函数用来收集捕获到的异常，然后批量发送到服务器端存储以便查询分析，那么我们会想要收集哪些信息呢？比较有用的信息包括：错误类型（name）、错误消息（message）、脚本文件地址（script）、行号（line)、列号（column）、堆栈跟踪（stack）。如果一个异常是通过 try-catch 捕获到的，这些信息都在 Error 对象上（主流浏览器都支持），所以 reportError 也能收集到这些信息。但如果是通过 window.onerror 捕获到的，我们都知道这个事件函数只有 3 个参数，所以这 3 个参数意外的信息就丢失了。

序列化消息

如果 Error 对象是我们自己创建的话，那么 error.message 就是由我们控制的。基本上我们把什么放进 error.message 里面，window.onerror 的第一个参数（message）就会是什么。（浏览器其实会略作修改，例如加上 'Uncaught Error: ' 前缀。）因此我们可以把我们关注的属性序列化（例如 JSON.Stringify）后存放到 error.message 里面，然后在 window.onerror 读取出来反序列化就可以了。当然，这仅限于我们自己创建的 Error对象。

第五个参数

浏览器厂商也知道大家在使用 window.onerror 时受到的限制，所以开始往window.onerror 上面添加新的参数。考虑到只有行号没有列号好像不是很对称的样子，IE 首先把列号加上了，放在第四个参数。然而大家更关心的是能否拿到完整的堆栈，于是 Firefox 说不如把堆栈放在第五个参数吧。但 Chrome 说那还不如把整个 Error 对象放在第五个参数，大家想读取什么属性都可以了，包括自定义属性。结果由于 Chrome 动作比较快，在 Chrome 30 实现了新的 window.onerror 签名，导致标准草案也就跟着这样写了。

window.onerror = function(
errorMessage,
scriptURI,
lineNumber,
columnNumber,
error
) {
if (error) {
    reportError(error);
} else {
    reportError({
      message: errorMessage,
      script: scriptURI,
      line: lineNumber，
      column: columnNumber
    });
}
}

属性正规化

我们之前讨论到的 Error 对象属性，其名称都是基于 Chrome 命名方式的，然而不同浏览器对 Error 对象属性的命名方式各不相同，例如脚本文件地址在 Chrome 叫做 script 但在 Firefox 叫做 filename。因此，我们还需要一个专门的函数来对 Error 对象进行正规化处理，也就是把不同的属性名称都映射到统一的属性名称上。具体做法可以参考这篇文章。尽管浏览器实现会更新，但人手维护一份这样的映射表并不会太难。

类似的是堆栈跟踪（stack）的格式。这个属性以纯文本的形式保存一份异常在发生时的堆栈信息，由于各个浏览器使用的文本格式不一样，所以也需要人手维护一份正则表达，用于从纯文本中提取每一帧的函数名（identifier）、文件（script）、行号（line）和列号（column）。

安全限制

如果你也遇到过消息为 'Script error.' 的错误，你会明白我在说什么的，这其实是浏览器针对不同源（origin）脚本文件的限制。这个安全限制的理由是这样的：假设一家网银在用户登录后返回的 HTML 跟匿名用户看到的 HTML 不一样，一个第三方网站就能把这家网银的 URI 放到 script.src 属性里面。HTML 当然不可能被当做 JS 解析啦，所以浏览器会抛出异常，而这个第三方网站就能通过解析异常的位置来判断用户是否有登录。为此浏览器对于不同源脚本文件抛出的异常一律进行过滤，过滤得只剩下 'Script error.' 这样一条不变的消息，其它属性统统消失。

对于有一定规模的网站来说，脚本文件放在 CDN 上，不同源是很正常的。现在就算是自己做个小网站，常见框架如 jQuery 和 Backbone 都能直接引用公共 CDN 上的版本，加速用户下载。所以这个安全限制确实造成了一些麻烦，导致我们从 Chrome 和 Firefox 收集到的异常信息都是无用的 'Script error.'。

CORS

想要绕过这个限制，只要保证脚本文件和页面本身同源即可。但把脚本文件放在不经 CDN 加速的服务器上，岂不降低用户下载速度？一个解决方案是，脚本文件继续放在 CDN 上，利用 XMLHttpRequest 通过 CORS 把内容下载回来，再创建

推荐专题

最新下载

热门教程

浏览器中捕获和分析javascript错误捕获经