注册 登录  
 加关注
   显示下一条  |  关闭
温馨提示!由于新浪微博认证机制调整,您的新浪微博帐号绑定已过期,请重新绑定!立即重新绑定新浪微博》  |  关闭

樱之花

叶散的时候,你明白欢聚;花谢的时候,你明白青春.

 
 
 

日志

 
 
关于我

分类中“我的实验室”是我在日常工作中的一些知识总结,有些写的比较匆忙,可能大家在阅读时会产生困扰,后期有时间我会重新整理编辑,谢谢大家的到访,您们的支持是我前进的动力!

网易考拉推荐

浅谈图形验证码的识别  

2012-01-12 14:01:07|  分类: 网站安全研究 |  标签: |举报 |字号 订阅

  下载LOFTER 我的照片书  |
   本问所讲的技术只是验证码识别的初级技术,只能识别一些简单的验证码,比如符合下列部分条件的:字体工整、位置固定、颜色统一、没有干扰点、背静单纯,初步体现了OCR原理(非常弱智:)

        本文讲的是通过抓特征点来达到识别目的。图片由一个一个的点(像素)组成,点的颜色变化就组成了我们看见的图片,呈现一个图象就是那几个点按照一定的顺序排列而已。
       比如csdn使用的验证码(下图),去掉上下左右的白边,每个数字使用8*12=96个像素,兰色的点就是我们看到的数字了,0-9这10个数字兰色点都是固定的,比如"4"就是是(0, 6)(0, 7)(1, 5)(1, 7)(2, 4)(2, 7)(3, 3)(3, 7)(4, 2)(4, 7)(5, 1)(5, 7)(6, 0)(6, 1)(6, 2)(6, 3)(6, 4)(6, 5)(6, 6)(6, 7)(6, 8)(6, 9)(6, 10)(6, 11)(7, 7)这些点组成如何得到,继续后面。
看起来复杂,实际上是很简单的,先简单处理下,你也许看的很明白,比如csdn登陆的验证码    

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 ,用mspaint.exe(画图)打开,放大到800%(查看--自定义--800%),

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 
,这里显示图片是一块一块组成了,现在我们需要把验证码的每个字符独立处理,就要确定字符范围了,如何确定?还是在mspaint.exe中,使用"选定"工具,保证每次划的框刚好把数字完整“框”起来,并且没有多余的空白……稍微花点工夫,就可以确定范围:四个字符的范围范围分别是以(3,4)、(12,4)、(21,4)、(30,4)作为左上角宽度是8高度是12的矩形。这些就是我的源代码里面
            Dim Rc1 As New Rectangle(3, 4, 8, 12)
            Dim Rc2 As New Rectangle(12, 4, 8, 12)
            Dim Rc3 As New Rectangle(21, 4, 8, 12)
            Dim Rc4 As New Rectangle(30, 4, 8, 12) 所定义的4个范围的由来了。

    选定中的界面

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 
选定后的界面,如果达到上面界面

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 

4个范围(图片处理过,实际上大不到图片的效果)

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 

        分解出来以后,就要抓特征点了,比如把上图第一个字符所在的范围单独出来,然后"画图"中鼠标移动到每个兰色点上,记下右下提示的坐标就可以了,下图:

浅谈图形验证码的识别 - yinzhihua2008 - 樱之花 yinzhihua2008

 
    分别把0-10个数字每个特征点记录下来就可以了:)--巨大的工作量???也有简单的办法,用程序自己读兰色点的坐标,我csdn小助手里面的坐标就是另外的一个程序读的。

   记录下这些点以后在程序中就抓取这些点判断是不是蓝色,如果全部符合,就可以判断识别这个图片的数字了。

   在  .net中如何实现这些过程?

    从地址加载验证码图片    
           Dim Rqq As HttpWebRequest
            Dim RPP As HttpWebResponse
            Rqq = HttpWebRequest.Create("验证码地址")
            Rqq.CookieContainer = New CookieContainer
            RPP = Rqq.GetResponse
            Dim Img As New System.Drawing.Bitmap(RPP.GetResponseStream)
   确定一个矩形范围:  Dim 范围 As New Rectangle(3, 4, 8, 12)
   复制某个范围的图片: 这个范围的图片 = 大图片.Clone(大图片的矩形范围, 大图片PixelFormat)
   得到某个点的颜色    :Img.GetPixel(坐标.X, 坐标.Y)
   
   具体的去看我的”csdn小助手“里面如何实现的吧。

   ==============
  识别率100%,速度极快识别一个的过程一般在几十毫秒级别内,如果要追求更快的速度,使用API直接操作图形,速度更快。
  总结 流程:确定范围,记录特征点,然后在程序中比较这些特征点颜色是不是设想的颜色。

   ====

   有人要问,位置不固定,有背景,有干扰色,颜色随机的验证码上该如何?这里不能给你确切的答案,每套验证码系统都有自己的特色,适当分析找出其中的规律:
       去背景色:统计每个颜色出现的次数,最多的颜色就是北京色,把这种颜色设置为白色就去掉背景了
       干扰点:孤立存在的点也就是上、下、左、右、左上、右上、左下、右下4个点都没有类似点的就是干扰点了
      ……

  评论这张
 
阅读(1026)| 评论(0)
推荐 转载

历史上的今天

在LOFTER的更多文章

评论

<#--最新日志,群博日志--> <#--推荐日志--> <#--引用记录--> <#--博主推荐--> <#--随机阅读--> <#--首页推荐--> <#--历史上的今天--> <#--被推荐日志--> <#--上一篇,下一篇--> <#-- 热度 --> <#-- 网易新闻广告 --> <#--右边模块结构--> <#--评论模块结构--> <#--引用模块结构--> <#--博主发起的投票-->
 
 
 
 
 
 
 
 
 
 
 
 
 
 

页脚

网易公司版权所有 ©1997-2017