Skip to content

yum-cloud-94/CAPTCHA-BREAK-AI

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

31 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

CAPTCHA-BREAK-AI

Breaking CAPTCHA for Intelligence RPA

프로젝트 개요

CAPTCHA를 무력화해서 Intelligence RPA를 구현하도록 하는 프로젝트이다.

폴더 설명

  1. DATA
    CAPTCHA 이미지를 Python Library로 생성

  2. Image_preprocessing
    Dillation, Close연산으로 선, 점의 노이즈를 제거해준다.

  • 원본 이미지
    그림1
  • 선 제거 이미지(Dillation 연산)
    그림2
  • 점 제거 이미지(Close 연산)
    그림3
  1. Modeling
    CRNN + CTC Layer 모델 사용
    Vanilla CAPTCHA Image와 Preprocessed CAPTCHA Image 두 가지 데이터를 모델에 적용

  2. Model_Test
    2,000개의 CAPTCHA 이미지를 추가로 생성
    Tesseract-OCR, CRNN+CTC Layer 모델로 결과를 비교

설치 패키지

  1. Tesseract-OCR
!pip install pytesseract
import pytesseract

# pytesseract 환경변수 설정 필요
pytesseract.pytesseract.tesseract_cmd = r'C:\Program Files (x86)\Tesseract-OCR\tesseract'

# 사용법 
pytesseract.image_to_string(image,config='--psm 6 oem 3, lang=eng)
  1. Generate CAPTCHA Image
!pip install captcha
from captcha.image import ImageCaptcha

About

Intelligence RPA, CAPTCHA-BREAK-AI

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published