问答题1299/1593说说你对 XSS 的了解

难度:
2021-07-04 创建

参考答案:

初探XSS

跨站脚本攻击,英文全称是 Cross Site Script,本来缩写是 CSS,但是为了和层叠样式表(Cascading Style SheetCSS)有所区别,所以在安全领域叫做“XSS”。

XSS攻击,通常指黑客通过HTML注入 篡改网页,插入恶意脚本,从而在用户浏览网页时,控制用户浏览器的一种攻击行为。在这种行为最初出现之时,所有的演示案例全是跨域行为,所以叫做 "跨站脚本" 。时至今日,随着Web端功能的复杂化,应用化,是否跨站已经不重要了,但 XSS这个名字却一直保留下来。

随着Web发展迅速发展,Web开发已经被应用的非常广泛了,由之前的单一PC端扩展到现在的移动端(APPH5),甚至包括桌面工具、设备大屏等等,所以在产生的应用场景越来越多,越来越复杂的情况下,同时大多数互联网(尤其是传统行业)的产品开发版本迭代上线时间非常短,一周一版本,两周一大版本的情况下,忽略了安全这一重要属性,一旦遭到攻击,后果将不堪设想。

XSS攻击类型分类

XSS攻击可以分为3类:反射型(非持久型)、存储型(持久型)、基于DOM XSS

反射型

反射型XSS只是简单地把用户输入的数据“反射”给浏览器。也就是说,黑客往往需要诱使用户“点击”一个恶意链接,才能攻击成功。反射型XSS也叫做 “非持久型 **XSS**”(**Non-persistent XSS**

通常反射型XSS的恶意代码存在URL里,通过URL传递参数的功能,如网站搜索、跳转等。由于需要用户主动打开恶意的URL才能生效,攻击者往往会结合多种手段诱导用户点击。

一个最初级的反射型攻击是:我们对网页数据进行获取:

1<!DOCTYPE html> 2<html lang="en"> 3<head> 4 <meta charset="UTF-8"> 5 <meta http-equiv="X-UA-Compatible" content="IE=edge"> 6 <meta name="viewport" content="width=device-width, initial-scale=1.0"> 7 <title>XSS攻防演练</title> 8</head> 9<body> 10 <div id="t"></div> 11 <input id="s" type="button" value="这是一个按钮" onclick="test()"> 12</body> 13<script> 14 function test() { 15 const arr = [ 16 '自定义的数据1', 17 '自定义的数据2', 18 '自定义的数据3', 19 '<img src="11" onerror="console.log(window.localStorage)" />' 20 ]; 21 const t = document.querySelector('#t'); 22 arr.forEach(item => { 23 const p = document.createElement('p'); 24 p.innerHTML = item; 25 t.append(p); 26 }) 27 } 28</script> 29</html>

当黑客点击这是一个按钮时,即可轻松获取本地localStorage数据,从而获取关键信息。

存储型

存储型 XSS 会把用户输入的数据“存储”在服务器端。这种 XSS 具有很强的稳定性。

比较常见的一个场景就是,黑客写下一篇包含有恶意 JavaScript 代码的博客文章,文章发表后,所有访问该博客文章的用户,都会在他们的浏览器中执行这段恶意的 JavaScript 代码。黑客把恶意的脚本保存到服务器端,所以这种 XSS 攻击就叫做 “存储型 **XSS**

1<!-- 例如我们分别在网站中的输入框中输入以下信息,并保存到远程数据库 --> 2<img src="11" onerror="console.log(window.localStorage)" /> 3<img src="11" onerror="alert(111)" />

页面输入

预览


预览

使用者浏览页面,分别先后触发了alert弹框和localStorage获取本地数据:

预览


预览
<br />以上就是一个典型的存储型攻击。

基于DOM XSS

实际上,这种类型的XSS并非按照“数据是否保存在服务器端”来划分,DOM Based XSS从效果上来说也是反射型XSS。单独划分出来,是因为DOM Based XSS 的形成原因比较特别,发现它的安全专家专门提出了这种类型的XSSDOM 型 XSS跟前两种XSS的区别:DOM 型 XSS攻击中,取出和执行恶意代码由浏览器端完成,属于前端JavaScript自身的安全漏洞,而其他两种XSS都属于服务端的安全漏洞。

接下来我们来看一个简单的示例:

1<!DOCTYPE html> 2<html lang="en"> 3<head> 4 <meta charset="UTF-8"> 5 <meta http-equiv="X-UA-Compatible" content="IE=edge"> 6 <meta name="viewport" content="width=device-width, initial-scale=1.0"> 7 <title>XSS攻防演练</title> 8</head> 9<body> 10 <h3>基于DOM的XSS</h3> 11 <input type="text" id="input"> 12 <button id="btn">提交内容</button> 13 <div id="div"></div> 14</body> 15<script> 16 const input = document.getElementById('input'); 17 const btn = document.getElementById('btn'); 18 const div = document.getElementById('div'); 19 20 let inputValue; 21 22 input.addEventListener('change', (e) => { 23 inputValue = e.target.value; 24 }, false); 25 26 btn.addEventListener('click', () => { 27 div.innerHTML = `<a href=${inputValue}>链接地址</a>` 28 }, false); 29</script> 30</html>

我们再页面输入框中输入以下文本'' onclick=alert(/xss/),这里的''引号是为了关闭掉href属性,给它赋予了一个空值。然后点击提交内容按钮,则页面中的<div id="div"></div>标签包含了一下html内容

1<a href onlick="alert(/xss/)">链接地址</a>

预览

XSS攻击防御

关于XSS的防御是非常复杂的,值得幸运的是现代浏览器、前端框架/库已经帮我们做了相当大的一部分工作。

HttpOnly

HttpOnly 最早是由微软提出,并在IE 6中最先实现的,至今已经逐渐成为一个标准。浏览器将禁止页面的JavaScript访问带有HttpOnly属性的Cookie。所以我们需要在http的响应头set-cookie时设置httpOnly,让浏览器知道不能通过document.cookie的方式获取到cookie内容。

严格地说,HttpOnly 并非为了对抗 XSS——HttpOnly 解决的是XSS后的 Cookie 劫持攻击。所以说使用HttpOnly有助于缓解XSS攻击,但仍然需要其他能够解决XSS漏洞的方案;

输入检查

对于用户的输入内容我们需要持怀疑态度。在对输入不做任何过滤检查的情况下用户可能输入任何字符串。比如我们期望输入的内容是:hello word, 也许我们收到的内容是onclick=alert(/xss/)

XSS的防御上,输入检查一般是检查用户输入的数据中是否包含一些特殊字符,如<、>、’、”等。如果发现存在特殊字符,则将这些字符过滤或者编码。这种输入检查的方式,可以称为“XSS Filter”。互联网上有很多开源的“XSS Filter”的实现。比如一个简单的htmlencode转义:

1const htmlEncode = function (handleString){ 2 return handleString 3 .replace(/&/g,"&amp;") 4 .replace(/</g,"&lt;") 5 .replace(/>/g,"&gt;") 6 .replace(/ /g,"&nbsp;") 7 .replace(/'/g,"&#39;") 8 .replace(/"/g,"&quot;"); 9}

但是输入检查也有弊端,比如

  • 攻击者绕过前端页面直接使用接口就可以提交恶意代码到远程库中。
  • 输入数据,还可能会被展示在多个地方,每个地方的语境可能各不相同,如果使用单一的替换操作,则可能会出现问题。输入检查也需要有针对性,如果我们想表达的意思是一个数小于另一个数( 3 < 4),前端转义后的字符就变成3 &lt; 4,当这个值被存到远端时后,再通过AJAX获取使用就会造成不必要的麻烦,比如我就进行数值计算等等。

输出检查

一般来说,除富文本的输出外,在变量输出到HTML页面时,可以使用编码或转义的方式来防御XSS攻击。

XSS的本质还是一种“HTML 注入”,用户的数据被当成了HTML代码一部分来执行,从而混淆了原本的语义,产生了新的语义。

如同输入检查一样,我们可以对输出进行编码转义。

1.在HTML中输出

比如我们的html代码中有这样一段代码:

1<div>$htmlVar</div> 2<a href="">$htmlVar</a>

如果输出的变量没有进行安全处理,直接使用并渲染在页面中,都能导致直接产生XSS。最终的结果可能生成一下代码:

1<div><script>alert('我是一个XSS攻击者')</script></div> 2<a href="#"><img href="" onclick="alert('我是另外一个XSS攻击者')"></a>

这个预防的方法就是对html进行转义检查

2. 在HTML属性中输出

如果我们的html属性时动态值,那么利用属性也可以被攻击;

1<div id="testXSS" data-name=""></div>

现在往data-name属性中插入一段未转义的代码"><script>alert('我是一个XSS攻击者')</script><",结果如下:

1<div id="testXSS" data-name=""><script>alert('我是一个XSS攻击者')</script><""></div>

3. 在<script>标签中输出

<script>标签中输出时,首先应该确保输出的变量在引号中。

1<script> 2 // 假设userData是攻击者注入的数据 3 let xssVar = userData; 4</script>

攻击者需要先闭合引号才能实施XSS攻击:

1<script> 2 // 假设userData是攻击者注入的数据 3 let xssVar = "";alert('我是一个script XSS攻击者'); 4</script>

4. 在CSS中输出

CSSstylestyle attribute 中形成 XSS 的方式非常多样化,所以,一般来说,尽可能禁止用户可控制的变量在“<style>标签”、“HTML标签的style属性”以及“CSS 文件”中输出。如果一定有这样的需求,则推荐使用一个关于CSS转义库。

防御DOM Based XSS

DOM Based XSS是一种比较特别的XSS漏洞,前文提到的几种防御方法都不太适用,需要特别对待。这个本质上,实际上就是网站前端JavaScript代码本身不够严谨,把不可信的数据当作代码执行了。

如果用 Vue/React 技术栈,并且不使用 v-html/dangerouslySetInnerHTML功能,就在前端render阶段避免innerHTMLouterHTMLXSS隐患。稍后会有专门的Vue关于XSS的防御段落。

会触发DOM Based XSS的地方有很多,以下几个地方是JavaScript输出到HTML页面的必经之路。

  • document.write();
  • document.writeln();
  • xxx.innerHTML();
  • xxx.outerHTML();
  • xxx.innerHTML.replace();
  • document.attachEvent();
  • window.attachEvent();
  • window.location();
  • window.name();

所以开发者需要重点关注这几个地方的参数是否可以被用户控制。如果项目中有用到这些的话,一定要避免在字符串中拼接不可信数据。

Vue中的XSS防御

如果你在项目中使用了Vue作为前端开发框架,恭喜你,Vue将为你解决绝大多数的XSS攻击问题,但是Vue不是一个预防XSS攻击的框架,在开发使用的时候还是有被攻击的漏洞存在;

Vue中的防御措施

不论使用模板还是渲染函数,Vue都会将插值的内容都会自动转义。也就是说对于这份模板:

1<template> 2 <p>{{userData}}</p> 3</template> 4 5<script> 6 // 从远程获取的数据 7 userData = "<script>alert('xss')</script>" 8</script>

最终编译后页面显示的html源码内容如下:

1<p> 2 <script>alert('xss')</script> 3</p>

原因是Vue帮我们对数据进行了转义,因此避免了脚本注入。该转义通过诸如 textContent 的浏览器原生的 API 完成,所以除非浏览器本身存在安全漏洞,否则不会存在安全漏洞。转义后的内容如下:

1&lt;script&gt;alert(&quot;xss&quot;)&lt;/script&gt;

注入HTML

如果你要动态注入远程的HTML内容,首先你应该确保这些内容是安全有效的,否则你应该采取一些防御措施,去过滤或转义掉一些危险的标签符号;例如你可以这样显示的渲染HTML

1<!-- 当使用模版时 --> 2<div v-html="userProvidedHtml"></div> 3 4<!-- 当使用渲染函数时 --> 5<script> 6 h('div', { 7 domProps: { 8 innerHTML: this.userProvidedHtml 9 } 10 }) 11</script> 12<!-- 当使用JSX 的渲染函数时 --> 13<div domPropsInnerHTML={this.userProvidedHtml}></div>

例如我们可以使用一个简单的方法(或者引用一个更加健壮的库/插件XSS来过滤一遍这个远程的userProvidedHtml数据内容,以确保安全;

1// 一个简单的函数,通过转义<为&lt以及>为&gt来实现防御HTML节点内容 2const escape = function(str){ 3 return str.replace(/</g, '&lt;').replace(/>/g, '&gt;') 4}

样式注入

在使用Vue 要在模板内避免渲染 style 标签:

1<style>{{ userProvidedStyles }}</style>

这是因为,一但通过userProvidedStyles,恶意用户仍可以提供 CSS 来进行“点击诈骗”,例如将链接的样式设置为一个透明的方框覆盖在“登录”按钮之上。然后再把https://user-XSS-website.com/ 做成你的应用的登录页的样子,它们就可能获取一个用户真实的登录信息,所以Vue推荐使用对象语法且只允许用户提供特定的可以安全控制的property的值:

1<!-- sanitizedUrl应为受控的地址 --> 2<a 3 v-bind:href="sanitizedUrl" 4 v-bind:style="{ 5 color: userProvidedColor, 6 background: userProvidedBackground 7 }" 8> 9 click me 10</a>

安全问题“没有银弹”

在解决安全问题的过程中,不可能一劳永逸,也就是说“没有银弹”。

一般来说,人们都会讨厌麻烦的事情,在潜意识里希望能够让麻烦越远越好。而安全,正是一件麻烦的事情,而且是无法逃避的麻烦。任何人想要一劳永逸地解决安全问题,都属于一相情愿,是“自己骗自己”,是不现实的。

最佳实践

通用的规则是只要允许执行未过滤的用户提供的内容 (不论作为 HTMLJavaScript 甚至 CSS),你就可能令自己处于被攻击的境地。这些建议实际上不论使用 VueReact还是别的框架甚至不使用框架,都是成立的。

最近更新时间:2024-08-10

赞赏支持

预览

题库维护不易,您的支持就是我们最大的动力!