检测 Lua 脚本中的死循环

本贴最后更新于 2221 天前,其中的信息可能已经天翻地覆

论坛上有人问,所以把以前做的东西拿出来秀一下。

Lua 是一门小巧精致的语言,特别适用于嵌入其它的程序为它们提供脚本支持。不过脚本通常是用户编写的,很有可能出现死循环,虽说这是用户的问题,但却会造成我们的宿主程序死掉。所以检测用户脚本中的死循环并中止这段脚本的运行就显得非常重要了。

可是,一个现实的问题是死循环并不好检测,一些隐藏较深的死循环连人都很难找出来,更不用说让机器去找了。所以实际采用的方案多是检测脚本的执行时间,如果超过一定的限度,就认为里面有死循环,我下面的例子也是用的这种方法。

以下是几个相关的全局变量(我是喜欢把 C++ 当 C 用的程序员,C++ 的忠实粉丝请忍耐一下😄)的定义。

lua_State* g_lua = NULL;            // lua脚本引擎
volatile unsigned g_begin = 0;        // 脚本开始执行的时间
volatile long g_counter = 0;        // 脚本执行计数, 用于判断执行超时
volatile long g_check = 0;           // 进行超时检查时的执行计数

run_user_script 用来执行用户脚本,它首先通过 GetTickCount 把当前的时间记录到 g_begin 中去。然后将 g_counter 加一,在执行完用户脚本后再将其加一,这样就可以保证执行用户脚本时它是个奇数,而不执行时是偶数,检测脚本超时的代码可以籍此来判断当前是否在执行用户脚本。还要注意调用用户脚本要使用 lua_pcall 而不是 lua_call,因为我们中止脚本的执行会产生一个 Lua 中的“错误”,在 C/C++ 中它是一个异常,只有用 lua_pcall 才能保证这个错误被 Lua 脚本引擎正确处理。

int run_user_script( int nargs, int nresults, int errfunc )
{
    g_begin = GetTickCount();
    _InterlockedIncrement( &g_counter );
    int err = lua_pcall( g_lua, nargs, nresults, errfunc );
    _InterlockedIncrement( &g_counter );
    return err;
}

下面的 check_script_timeout 用来检测脚本超时,需要在另外一个线程中周期性的调用,原因我想就不用解释了吧。它首先检查是否在执行用户脚本,或者是否已经让当前执行的用户脚本中止过。然后看这段脚本执行了多长时间,超过限度就把当前脚本计数记录到 g_check 中去,并通过 lua_sethook 设置一个钩子函数 timeout_break,这个钩子函数会在用户脚本执行时被调用。

void check_script_timeout()
{
    long counter = g_counter;
 
    // 没有执行用户脚本, 不检查超时
    if( (counter & 0x00000001) == 0 )
        return;
 
    // 已经让当前执行的用户脚本中止了
    if( g_check == counter )
        return;
 
    // 如果执行时间超过了设置的超时时间(这里是1秒), 终止它
    if( GetTickCount() - g_begin > 1000 )
    {
        g_check = counter;
        int mask = LUA_MASKCALL | LUA_MASKRET | LUA_MASKLINE | LUA_MASKCOUNT;
        lua_sethook( g_lua, timeout_break, mask, 1);
    }
}

最后就是那个钩子函数了,它首先把钩子去掉,因为这个钩子只要执行一次就行了。由于设置钩子和执行钩子是在不同的线程中,并且钩子从设置到执行需要一定的时间,所以它要通过对比 g_checkg_counter 来判断是否还在运行判断超时所执行的那段脚本,不是就什么也不做,是就通过 luaL_error 产生一个错误,并中止脚本的执行,而这个错误最终会被 run_user_script 中的 lua_pcall 捕获。

void timeout_break( lua_State* L, lua_Debug* ar )
{
    lua_sethook( L, NULL, 0, 0 );
    // 钩子从设置到执行, 需要一段时间, 所以要检测是否仍在执行那个超时的脚本
    if( g_check == g_counter )
        luaL_error( L, "script timeout." );
}

上面的检测使用了两个线程,其实在一个线程中也可以做到,并且更简单。但那样会导致钩子函数频繁执行,影响效率,如果对性能没什么要求的话,也可以采用。

  • Lua
    16 引用 • 17 回帖 • 1 关注
  • 算法
    388 引用 • 254 回帖 • 22 关注

相关帖子

欢迎来到这里!

我们正在构建一个小众社区,大家在这里相互信任,以平等 • 自由 • 奔放的价值观进行分享交流。最终,希望大家能够找到与自己志同道合的伙伴,共同成长。

注册 关于
请输入回帖内容 ...
  • lpy
    该回帖仅作者和楼主可见

推荐标签 标签

  • 大数据

    大数据(big data)是指无法在一定时间范围内用常规软件工具进行捕捉、管理和处理的数据集合,是需要新处理模式才能具有更强的决策力、洞察发现力和流程优化能力的海量、高增长率和多样化的信息资产。

    89 引用 • 113 回帖
  • OpenStack

    OpenStack 是一个云操作系统,通过数据中心可控制大型的计算、存储、网络等资源池。所有的管理通过前端界面管理员就可以完成,同样也可以通过 Web 接口让最终用户部署资源。

    10 引用 • 6 关注
  • 前端

    前端技术一般分为前端设计和前端开发,前端设计可以理解为网站的视觉设计,前端开发则是网站的前台代码实现,包括 HTML、CSS 以及 JavaScript 等。

    247 引用 • 1347 回帖
  • RabbitMQ

    RabbitMQ 是一个开源的 AMQP 实现,服务器端用 Erlang 语言编写,支持多种语言客户端,如:Python、Ruby、.NET、Java、C、PHP、ActionScript 等。用于在分布式系统中存储转发消息,在易用性、扩展性、高可用性等方面表现不俗。

    49 引用 • 60 回帖 • 399 关注
  • 钉钉

    钉钉,专为中国企业打造的免费沟通协同多端平台, 阿里巴巴出品。

    15 引用 • 67 回帖 • 370 关注
  • HTML

    HTML5 是 HTML 下一个的主要修订版本,现在仍处于发展阶段。广义论及 HTML5 时,实际指的是包括 HTML、CSS 和 JavaScript 在内的一套技术组合。

    103 引用 • 294 回帖
  • Thymeleaf

    Thymeleaf 是一款用于渲染 XML/XHTML/HTML5 内容的模板引擎。类似 Velocity、 FreeMarker 等,它也可以轻易的与 Spring 等 Web 框架进行集成作为 Web 应用的模板引擎。与其它模板引擎相比,Thymeleaf 最大的特点是能够直接在浏览器中打开并正确显示模板页面,而不需要启动整个 Web 应用。

    11 引用 • 19 回帖 • 319 关注
  • Postman

    Postman 是一款简单好用的 HTTP API 调试工具。

    4 引用 • 3 回帖
  • 域名

    域名(Domain Name),简称域名、网域,是由一串用点分隔的名字组成的 Internet 上某一台计算机或计算机组的名称,用于在数据传输时标识计算机的电子方位(有时也指地理位置)。

    43 引用 • 208 回帖 • 1 关注
  • Linux

    Linux 是一套免费使用和自由传播的类 Unix 操作系统,是一个基于 POSIX 和 Unix 的多用户、多任务、支持多线程和多 CPU 的操作系统。它能运行主要的 Unix 工具软件、应用程序和网络协议,并支持 32 位和 64 位硬件。Linux 继承了 Unix 以网络为核心的设计思想,是一个性能稳定的多用户网络操作系统。

    915 引用 • 931 回帖
  • Kafka

    Kafka 是一种高吞吐量的分布式发布订阅消息系统,它可以处理消费者规模的网站中的所有动作流数据。 这种动作(网页浏览,搜索和其他用户的行动)是现代系统中许多功能的基础。 这些数据通常是由于吞吐量的要求而通过处理日志和日志聚合来解决。

    35 引用 • 35 回帖
  • Git

    Git 是 Linux Torvalds 为了帮助管理 Linux 内核开发而开发的一个开放源码的版本控制软件。

    205 引用 • 357 回帖
  • FlowUs

    FlowUs.息流 个人及团队的新一代生产力工具。

    让复杂的信息管理更轻松、自由、充满创意。

    1 引用
  • Vim

    Vim 是类 UNIX 系统文本编辑器 Vi 的加强版本,加入了更多特性来帮助编辑源代码。Vim 的部分增强功能包括文件比较(vimdiff)、语法高亮、全面的帮助系统、本地脚本(Vimscript)和便于选择的可视化模式。

    27 引用 • 66 回帖
  • Swift

    Swift 是苹果于 2014 年 WWDC(苹果开发者大会)发布的开发语言,可与 Objective-C 共同运行于 Mac OS 和 iOS 平台,用于搭建基于苹果平台的应用程序。

    34 引用 • 37 回帖 • 498 关注
  • JRebel

    JRebel 是一款 Java 虚拟机插件,它使得 Java 程序员能在不进行重部署的情况下,即时看到代码的改变对一个应用程序带来的影响。

    26 引用 • 78 回帖 • 623 关注
  • GitLab

    GitLab 是利用 Ruby 一个开源的版本管理系统,实现一个自托管的 Git 项目仓库,可通过 Web 界面操作公开或私有项目。

    46 引用 • 72 回帖
  • 宕机

    宕机,多指一些网站、游戏、网络应用等服务器一种区别于正常运行的状态,也叫“Down 机”、“当机”或“死机”。宕机状态不仅仅是指服务器“挂掉了”、“死机了”状态,也包括服务器假死、停用、关闭等一些原因而导致出现的不能够正常运行的状态。

    13 引用 • 82 回帖 • 38 关注
  • Wide

    Wide 是一款基于 Web 的 Go 语言 IDE。通过浏览器就可以进行 Go 开发,并有代码自动完成、查看表达式、编译反馈、Lint、实时结果输出等功能。

    欢迎访问我们运维的实例: https://wide.b3log.org

    30 引用 • 218 回帖 • 605 关注
  • HHKB

    HHKB 是富士通的 Happy Hacking 系列电容键盘。电容键盘即无接点静电电容式键盘(Capacitive Keyboard)。

    5 引用 • 74 回帖 • 407 关注
  • 运维

    互联网运维工作,以服务为中心,以稳定、安全、高效为三个基本点,确保公司的互联网业务能够 7×24 小时为用户提供高质量的服务。

    148 引用 • 257 回帖
  • 一些有用的避坑指南。

    69 引用 • 93 回帖 • 2 关注
  • 996
    13 引用 • 200 回帖
  • LaTeX

    LaTeX(音译“拉泰赫”)是一种基于 ΤΕΧ 的排版系统,由美国计算机学家莱斯利·兰伯特(Leslie Lamport)在 20 世纪 80 年代初期开发,利用这种格式,即使使用者没有排版和程序设计的知识也可以充分发挥由 TeX 所提供的强大功能,能在几天,甚至几小时内生成很多具有书籍质量的印刷品。对于生成复杂表格和数学公式,这一点表现得尤为突出。因此它非常适用于生成高印刷质量的科技和数学类文档。

    9 引用 • 32 回帖 • 166 关注
  • SSL

    SSL(Secure Sockets Layer 安全套接层),及其继任者传输层安全(Transport Layer Security,TLS)是为网络通信提供安全及数据完整性的一种安全协议。TLS 与 SSL 在传输层对网络连接进行加密。

    69 引用 • 190 回帖 • 495 关注
  • Swagger

    Swagger 是一款非常流行的 API 开发工具,它遵循 OpenAPI Specification(这是一种通用的、和编程语言无关的 API 描述规范)。Swagger 贯穿整个 API 生命周期,如 API 的设计、编写文档、测试和部署。

    26 引用 • 35 回帖 • 13 关注
  • 安全

    安全永远都不是一个小问题。

    189 引用 • 813 回帖 • 1 关注