米乐 M6米乐AI“攻破”验证码系统原来这些反人类设计的验证码只难住了“我”
最近看到了个消息:AI 识别验证码,现在比人都快了。不仅快,准确率还吊打人类。
这不,前段时间加州大学艾尔文分校就甩出了一份论文,里面的研究数据是啪啪打验证系统的脸。
简单来说,他们把市面上所有类型的验证码,点击类的,拖拽旋转类的,图片选择类的等等等等,都搜罗了过来,分别让 AI 和测试者做了个遍。其中,最简单的点击识别, AI 直接 1.4 秒就能过,还百分百准确度,而人类不但要得花 3~4 秒,竟然有一两成的人过不了。
到拉大难度的图片验证, AI 虽然在速度上稍有下降,但起码还保持在人类的平均水平里,准确度也和人类相当。
测试结果大家也都看到了,看这AI 几乎门门儿接近百分百的准确率,速度也普遍比人快,说夸张点已经是吊打人类的程度了。
图片反正论文提交后,这个项目的主任 Gene Tsudik 直接给验证码戴了个 “ 气数已尽 ” 的帽子。还有一些媒体甚至打出 “ 暴击人类 ” 、 “ 验证码失效 ” 、 “ 验证码被攻破 ” 之类的标题。连马斯克都出来发文称,过去的验证机器人全失效了。
原始的上网环境,是没有验证码的,所以垃圾评论和邮件畅通无阻。当时免费邮件提供商雅虎,为了解决用户受到骚扰的问题,耗费了众多资源都阻止不了垃圾邮件,于是他们找到年仅 21 岁的卡内基梅隆大学计算机天才路易斯。路易斯给出的建议,就是安排计算机产出一个随即的字符串,用程式将这个字符串的图像进行随机污染和打乱,使其扭曲或变形,以此来区分大活人和机器人。
这样的方法,可以避免黑客恶意破解密码,刷票,论坛灌水,黄牛抢票等行为。本质上呢,其实是反机器的人类好帮手。数字或字母验证码渗透到各大网站和论坛,发展了许多年,但随着计算机水平的不断提高,这种简单的设计对黑客来说已经是小菜一碟了,也就失去了保护的意义。
最常见的,就是行为式验证码,比如说狐妹觉得最幼稚且没用的滑动验证码。实际上,我们在操作滑动这个步骤时,会有一个稍稍延迟的动作,然后才进行滑块拖动,拖动时的快慢也是不一致的。
这个就类似于 2012 年爆火的寻物游戏《找你妹》,相信大家都玩过。看似无脑的验证过程,实际上,验证码上的图片采用了多种图像加密技术,文字则采用了多种字体和实时印刷技术,并且添加了很多随机效果,能够有效防止 OCR 文字识别。
在技术迭代十分迅速的互联网领域,要确保安全,意味着安防措施必须永远比黑客领先一步。
谢强表示,互联网安全是一个相互博弈的过程,“我提高了一定的门槛,然后你跟随着我去成长,然后我再去提到更高的门槛”。只要保证安防成本永远比黑客低,就能让黑灰产陷入到博弈对抗,使其成本越来越高。
当前,随着GPT-4等AI大模型的成熟,对互联网安防也提出了新的要求。极意科技相关负责人表示,AI技术的发展,普通用户也能很快上手使用这些工具。但技术带来的便利性,也让互联网黑灰产的技术门槛大大降低。
从网络安防的角度,解决方案就是回归到AI对抗。毕竟能防住AI的,只有另一个AI。
顶象CEO陈树华告诉36氪,为避免版权问题,验证码公司需要自己生成图片,但一个设计师的生产力最多可以达到一天十张左右。有了AIGC,顶象生成图片的频率提升,从而降低了黑灰产快速破解的概率。陈树华表示,在过去的图库更新速度下,黑灰产快速爬取完图库的概率较高。大家辛苦设计了很久,但黑灰产把图片全部爬下来,很可能是瞬间的一件事。接下来就可以发动针对性攻击。也就是说,整个对抗力量是不对等的,这个问题一直是行业痛点。陈树华表示。
据介绍,使用AIGC工具后,顶象图片的生产效率提升上万倍。以单个GPU计算机为例,利用AIGC技术20秒就可以生成一张图片。使用100个GPU的小型计算集群,一天就可以生成43万2000张新的图片,一个月可以生成超过1000万张新图片。AIGC的生产能力是人工制图的上万倍。陈树华说。
而提升图片更新效率,不仅能相对弥补攻防双方的力量差距,还能减轻业务安全公司员工的部分工作。比如,图片库的配置工作就可以减少。目前看管理员配置效率提升了50%。陈树华介绍。
但其实,内容生成不是全新事物。陈树华告诉36氪,顶象早前已开始探索图片生成。据介绍,顶象原先采用将3D模型和有限的背景结合生成的方式,生成不重复的背景图片,希望解决传统验证方式使用有限集合背景图片,导致被破解的问题。
但这次大模型的能力让陈树华还是觉得打开了思路。原因在于,之前的生成方式不能做到图片质量的稳定,而这次基于大模型而生成的图片,不仅速度快,图片审美也得到了提升。验证码的图片一定要是一眼看上去可接受的、自然的。否则用户是不米乐M6 米乐会使用这类产品的。他认为。
AIGC为验证码安全提供的好处不止如此。据介绍,利用AIGC,验证码厂商还可以优化已有的验证方式,甚至创造出一些对用户友好、但机器识别难度较高的新型验证码。比如,常见的滑块验证码,为保证有足够识别度,目标缺口的像素与周围的像素需要有一些差异,往往非常容易识别,能让黑灰产较轻易地判断出滑块的目标位置。利用AIGC,可以设计出没有缺口的滑块验证码,要判断出目标位置还需要理解图像的语义,由此增加黑灰产的破解难度。
顶象为整体的使用效果做了测试,发现使用AIGC后,产品的风险拦截率提升19%。对比来说,使用静态图库作为验证码图片时,图库更新一周以后,爬虫的拦截防御能力会出效果衰减,一个月左右,恶意爬虫通过率会达到20%。使用AIGC生成图片后,爬虫通过验证通过率立即下降至0.8%以下,且长时间维持在1%以内。
当前,顶象主要使用Stable Diffusion生成图片,正在测试Midjourney等其他大模型。但不论是哪种工具,都可能出现生成图片的图片不准确、不符合逻辑(比如人像中出现六根手指)的情况。为避免影响商用,顶象如今采用限定标签的方式,重点生成特定领域的、可控的图片。
据介绍,当前公司的AIGC图片的标签库,包括植物、风景、交通工具、食物以及生活用品等,按照小类划分,大概有110多种。目前标签库主要以常见的实物为主——如大海中的轮船、十字路口的红绿灯、大海中的轮船、十字路口的红绿灯等。后续,顶象计划将标签库拓展到生活家居、计算机等,客户也可以根据自己的行业属性、业务特点、业务场景自定义标签。
另外,生成的图片也要避免内容安全问题。陈树华表示,顶象当前会在产品内叠加更多的算法,用以检测内容。
在交付方式上,目前顶象的SaaS用户已经可以体验到加入AIGC能力后的产品。但私有化部署的客户,由于交付方式较复杂和客户方算力成本较高等因素,暂时没能参与其中。
陈树华认为,大模型的另一个好处是改变国内To B产业的交付方式。大模型最大的特点就是智能化能力的提升。但要出现这一效果,必须让大量数据、服务得以汇聚。他认为,如果客户都认可大模型的智能化能力,那么To B长期私有化部署的产业形态可米乐M6 米乐能会减弱。
另一个不可忽视的可能性是,理论上,大模型的能力对所有人开放,这意味着黑产也可以利用AIGC增强破解能力——基于AIGC,黑灰产或许不再需要采集验证码厂商的图库并打标,就能训练模型识别各种艺术字。在这种场景中,黑灰产可以利用AIGC自动生成大量汉字对应的各种样式的艺术字,作为数据集训练模型,让模型鲁棒地识别任何风格的艺术字。
也许在不久的将来,艺术字验证码这种验证方式将完全失效。这也会进一步推动验证码企业提升验证方式的安全性和对抗性。陈树华如此认为。
扫一扫关注微信公众帐号